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一 、 测 量 的 层次 


所 请 测量 ,就 是 根据 一 定 的 法 风 , 给 素 物 或 事件 分 配 一 定 的 数 
字 或 符号 ,如 测量 职工 对 所 从 事 职 业 的 满意 程度 ,可 以 分 配 0 至 10 
的 数字 ,不 满意 给 0 分 ,很 满意 给 10 分, 介 于 二 者 之 间 的 分 配 中 阅 
的 数字 .于 是 ,0 至 10 这 些 抽象 的 数字 符号 就 依据 计 述 规定 的 法 
则 ,表示 职工 对 所 从 事 职业 的 满意 程度 。 测 量 的 作用 在 于 准确 地 描 
E FAKAN .性质 .状态 ,局 时 对 事 特 之 间 的 差异 进行 准确 度量 
和 比较。 事物 只 有 通过 测量 , 才 有 可 能 选择 适当 的 统计 横 型 或 公 
式 , 进 行 一 系列 的 统计 分 析 。 

目前 ,广泛 采用 的 测量 层次 为 四 种 类 型 的 尺度 : 定 类 尺度 、 定 

FREER EYRE. 

. (一 ) 定 类 尺度 

定 类 尺度 是 按照 事物 的 茜 些 特征 辨别 各 划 分 它们 异同 的 一 种 
调 量 层次 ,也 被 称 作 类 别 尺度 .名 文 尺度。 如 性 别 . 职 业 . 民 族 等 ,都 
是 按照 事物 的 性 质 . 类 别 区 分 的 , 均 属 定 类 尺度 。 

测量 时 ,无 论 哪 一 种 测量 层次 ,都 必须 具有 完备 人 性 和 屯 斥 性 。 
完备 性 ,是 指 用 这 种 尺度 测量 基 事 物 时 ,必须 对 这 一 事物 所 包括 的 
各 种 情况 都 能 进行 测量 。 如 测量 性 别 时 ,应 包括 性 别 的 各 种 情况 ， 
3j. 女 , 不 能 有 遗漏 。. 互 斥 性 ,是 指 用 这 种 尺度 测量 时 ,不 能 有 尾 一 
被 测量 对 象 跨越 类 列 , 即 事物 的 各 种 情况 具有 互相 排斥 的 不 同 值 。 
如 测量 性 别 时 ,分 为 互 斥 的 两 类 : 男 . 女 , 某 人 或 属于 男 ,或 属于 女 ， 
ANS BE i MP i. ME eK Se SOE. bA RENI 
量 的 淮 确 无 误 . 

定 类 尺度 只 能 将 事物 分 类 ,不 能 用 以 反映 事物 的 数量 状 帝 ,有 
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时 , 为 了 识别 不 同 的 类 别 , 也 用 -- 定 的 数字 和 符号 表示 某 类 事物 。 
如 职工 对 所 从 事 的 职业 是 否 满意 ,可 以 用 *0” 表 示 不 满意 。 用 "1? 
表示 满意 ,这 仅仅 是 人 们 赋予 的 识别 标志 ,并 不 说 明 事物 的 数量 ， 
定 类 尺度 是 最 低 一 个 层次 的 测量 尺度 , 它 不 能 进行 算术 运算 ,而 只 
能 进行 “二” 或“ 关 * 的 逻辑 运算 . 定 类 测量 数据 的 描述 性 统计 量 
LET CUN UL S 

(二 ) 定 序 尺度 

定 序 尺度 是 按照 事物 的 某 种 特征 依 顺序 和 级 别 进行 排列 的 一 
种 测量 层次 ,也 称 作 顺序 尺度 ,等 级 尺度 。 例 如 ,测量 职工 的 文化 程 
度 可 以 采用 定 序 尺 度 , 分 为 :大 专 以 上 ,中 专 或 高 中 ,初中 ,小 学 , 显 
热 前 面 的 类 别 要 比 后 面 的 类 别 高 , 妈 前 面 的 文化 程度 最 高 ,依次 隆 
低 , 定 序 尺度 不 仅 能 够 区 分 事物 , 即 对 事物 进行 分 类 ,而 且 可 以 反 
BS 事物 在 高 低 、 大 小 , 强 弱 上 的 差异 ,也 就 是 使 类 别 之 间 具 有 次 序 
比较 关系 . 定 序 尺度 是 比 定 类 尺度 高 一 层次 的 测量 , 它 不 仅 能 进行 
“一 ”或 * 关 ”的 运算 ,还 能 进行 “> ” “< 的 运算 。 最 适合 措 述 定 序 
尺度 中 数据 集中 趋势 的 统计 量 是 中 位 数 ,反映 离散 程度 的 是 分 位 
MX. 

(2) HIERE 

TERA ARA AIR MAA ER 
之 间 的 数量 差别 ,间隔 距离 的 一 种 测量 层次 ,也 称 作 间 隔 尼 度 、 区 
冶 尺 说 ,例如 ,对 学 生 学 习 成 绩 的 测量 , 甲 为 90 分 , 乙 为 85 分 , 甲 
乙 学 生成 绩 间距 为 90 一 85 = 5 4 MERA ER EEE 
尺度 没有 绝对 的 零点 ,也 就 是 说 ,在 这 种 测量 中 ,任何 两 个 间隔 的 
差异 汝 零点 无 关 。 例 如 , 某 门 课程 成 绩 的 百分制 测量 ,0 分 不 表示 
某 考 生 没 有 这 门 课 方 面 的 知识 ,90 一 85 = 5 分 ,只 表明 甲 生 比 乙 
^E 在 这 门 课 考 斌 成 绩 中 多 5 分 ,并 不 能 说 明 甲 生 掌 握 的 这 方面 知 
识 是 乙 生 的 大 约 1.06 倍 (90/85), 定 中 尺度 在 实际 应 用 中 较为 普 
it, 象 温度 .智商 等 都 是 定 距 测量 , 定 距 尺度 是 一 种 定量 的 测量 层 
次 , 它 不 仅 能 反映 事物 的 类 别 和 顺序 ,而 且 能 反映 事物 的 具体 数量 
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和 数量 之 间 的 距离 , 它 是 比 定 序 尺度 又 高 一 层次 的 测量 ,不 仅 能 进 
fies tA Ae < 的 运算 ,还 能 进行 “十 ?“ 一 ”的 运算 。 征 
E 尺度 中 搞 述 性 统计 量 ,除了 反映 集中 趋 执 的 众 数 ,中 位 数 、 均 值 
外 ,还 有 反映 离散 程度 的 方差 .标准 差 等 ,一 般 的 定量 统计 方法 都 
可 以 在 这 一 测量 层次 应 用 。 

(m RERA 

定 比 尺度 是 在 定 中 尺度 上 增加 绝对 零点 的 一 种 测量 层次 ,也 
称 作 等 比 尺度 、 比 率 尺 度 , 人 重 如 对 职工 年 龄 的 测量 ,这 里 0 PEE 
任意 的 ,一 个 人 人 年龄 不 可 能 比 0 岁 更 小 ,这 一 测量 尺度 对 所 有 人 都 
-HATA 40 岁 , 乙 为 20 岁 , 则 甲 的 年 龄 是 乙 的 2 人 悦 , 这 就 是 定 
比 尺度 的 测量 ,是 否 具有 实际 意义 的 零点 存在 ,是 定 比 尺度 与 定 距 
REM EES. CUR BATA Se SEE AER 
HE 更 利于 反映 事物 之 间 的 出 例 或 比率 关系 , 它 是 所 有 测量 层次 中 
RR — AE, MERA A em A 
E A 的 运算 .在 定 比 测量 中 ,描述 性 统 
计量 不 仅 有 算术 平均 的 均值 ,还 有 几何 平均 的 均 慎 ,不 仪 有 方差 、 
均 方 差 ,还 有 变异 系数 等 。 

CA) AR) Y Rx xA 

四 种 测量 尺度 有 着 不 同 的 特点 ,其 主要 表现 在 作用 和 运算 性 
质 上 ,但 它们 之 间 义 有 较为 密切 的 关系 ,首先 ,这 些 测 量 尺度 之 间 
有 着 包含 关系 , 即 高 一 层次 的 测量 尺度 总 是 包含 低 晨 次 的 测量 尺 
Es 定 序 尺度 包含 了 定 类 尺度 所 有 运算 性 质 , 定 距 尺度 包含 了 定 
序 、 定 类 尺度 所有 运算 性 质 ,而 定 比 尺度 则 包含 了 记 有 测量 层次 的 
运算 性 质 , 其 次 ,四 种 测量 尺度 之 间 , 低 级 的 测量 尺度 往往 能 用 较 
高 级 的 测量 尺度 形式 表示 。 例 如 ,对 学 生 考试 成 绩 的 测量 ,进行 定 
类 测量 可 分 为 及 格 .不 及 和 猪 : 若 将 及 格 的 成 绩 高 低 排序 ,可 分 为 优 、 
R., 中 及格 ,这 是 定 序 尺度; 若 再 将 各 顺序 级 给 出 等 级 分 , 则 按 百 
Ari E, 优 :90 分 以 上 , 良 :80 一 90 分 , 中 :70 一 80 4, 及格， 
60—70 分。 对 同一 事物 的 测量 可 以 用 多 种 尺度 时, 为 避免 信息 的 
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丢失 ,应 尽量 将 低层 次 测量 尺度 变 成 较 高 层次 的 民 度 来 测量 。 由 于 
不 同 的 测量 层次 具有 不 同 的 数学 性 质 ,因而 在 统计 资料 的 收集 、 穆 
理 . 分 析 过 程 中 ,往往 需要 采用 不 同 的 统计 方法 ,也 就 是 说 ,统计 方 
法 的 运用 总 是 与 所 选择 的 测 其 尺度 相 联 系 。 在 实际 应 用 时 ,要 首先 
ARTIS MR Be 与 所 获得 的 资料 采用 的 测量 尺度 是 
GK 


二 .统计 检验 


近代 统计 学 的 中 心 课题 是 统计 推断 ,在 统计 推断 中 涉及 这 样 
的 问题 :如 何 利用 部 分 事件 的 观察 作出 大 量 事件 的 结论 .例如 ,要 
确 定 几 种 牌 刁 的 彩色 电视 机 在 我 国 居民 中 哪 种 最 受 欢 迎 , 可 以 这 
位 去 搜 信 资料: 到 一 家 最 大 的 商场 站 在 柜台 边 ,计数 一 天 中 每 种 牌 
号 彩电 的 销售 数量 ,几乎 可 以 肯定 那儿 种 牌号 彩电 销量 不 同 . 但 能 
E 推断 : 那 一 天 在 这 家 商场 销量 最 多 的 彩电 是 最 受 我 国 居 民 欢 迎 
的 呢 ? 这 取决 于 那 种 彩 电 的 销售 地 域 ,也 取决 于 那 家 商场 的 代表 
性 ,还 取决 于 所 观察 的 那些 买主 的 代表 性 ,统计 检验 正 是 要 解决 这 
一 问题 ;如何 根据 样本 值 判断 所 得 出 的 结论 是 否 正确 。 

统计 检验 的 一 般 步 又 为 ; 

陈述 零 假 设 CH,)， 

选择 一 种 统计 检验 来 检验 HI; 

给 定 显著 性 水 平 e 和 和 样本 容量 n 

RH H., RRA EI BRE s 

E XE. 

剩 用 样本 资料 计算 统计 检验 值 ,车 其 值 薄 在 香 定 域 , 则 拒绝 
Hoy SE TE BERS Sh, 则 在 所 选择 的 显著 性 水 平 上 ， 不 能 拒绝 
H, 

{一 ) ERIE 

零 假 秋 是 一 种 无 差别 假设 ,表示 要 被 拒绝 的 目的 ， tE BR Es I 

DE EIE CH, DOR PET SEB SEAS A, AR Re Ld PEE 
4 


O E A AA AAA A PRE 
不 同 .这 个 结论 是 要 研究 的 假设 ,为 了 检验 它 , 一 般 把 它 陈述 为 备 
择 假 设 BIA Fs SE E BA A 天 p Hy jiu p: 121 — fos 
E HHWR RRZS ITA R R A A. .如果 搜集 的 资料 允许 
拒绝 A, A, 被 接受 ,这 就 支持 了 研究 假设 以 及 由 它 导 出 的 理 
i£. 

A; 的 叙述 是 由 研究 假设 的 性 质 确定 的 .车 研究 假设 只 是 考察 
两 个 事物 有 差异 , 则 备 择 假设 A 为 内 关 pp; 兰考 察 其 差 值 的 方 
El -W E REA 后 D> MBA n << be o Sey RR SO AA: a 
AREO, APR A REA CO, 

(5) AAA 

假设 检验 是 根据 人 人们 一 条 普遍 的 经 验 作 为 原则 的 , 即 小 概率 
事件 在 一 次 实验 中 很 难 发 生 .如 果 一 旦 发 生 , 就 认为 原来 的 假设 不 
成 立 , 上 所 而 措 绝 态 ,, 但 是 ,很 难 发 生 并 不 等 于 决 不 发 生 , 因 此 ,在 稳 
出 对 五 ,的 判定 时 ,可 能 会 发 生 丁 类 错误 ,第 一 类 错误 是 当 OH, 空 
际 上 为 真 时 拒绝 互 。; 第 二 类 错误 是 当 H, 实际 为 殷 时 接受 A 
一 类 错误 是 “以 真 为 假 ” 的 错误 , 犯 第 一 类 错误 的 概率 由 so 给 出 ,a 
越 天 ,五 。 越 容易 错误 地 被 拒绝 ;第 二 类 错误 是 “以 假 当真 ”的 错 
误 , 犯 第 一 类 错误 的 概率 通常 用 8 表示 ,由 于 犯 这 两 类 错误 的 概率 
之 间 和 存在 着 反比 关系 ,因而 , 当 样 本 数目 一 定时 ,a 减 小 将 使 8 增 
大 。 知 希望 同时 减 小 犯 两 类 错误 前 可 能 竹 , 必 须 增 加 样本 数目 m. 

实际 垃 用 时 ,人 们 通常 只 能 控制 犯 第 一 类 错误 的 概率 ,也 就 是 
95 误 地 拒绝 H, 的 概率 ,这 个 概率 就 叫做 显著 性 水 平 , 它 一 般 在 进 
行 统计 检验 时 事先 给 定 。 在 选 定 e 的 大 小 时 ,应 根据 实际 情况 考 
虞 .着 宁 可 “以 真 为 假 ”, 则 应 把 a 取得 小 些 ,如 0. 01; 否 则 ,a 可 取 大 
些 , 一 般 检 验 时 , 取 a = 0.05,4 = 0.01 较 多 ,为 了 保证 有 RK 
大 ,样本 数目 不宜 太 少 (如 至 少 不 小 于 5)。 

{三 ) 否定 域 

拒绝 等 假设 五 , 的 区 域 称 为 否定 域 或 拒绝 域 .否定 域 的 大 小 
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与 显著 性 水 平 e EA A A E EA, EAL FI BY e 
值 ,可 能 得 到 截然 相反 的 结论 ,如 取 a = 0.05, nTRETR LE Ho, MER a 
= 0.01, 则 不 能 拒绝 A, eH a HRN. PRBS”. T a 
“以 真 为 假 ” 时 ,应 取 很 小 的 a 值 ,下 是 基于 否定 域 与 a 的 关系 建 辽 
的 。 

是 指出 预定 方向 的 ,如 吾 ,: > pm; 则 假设 检验 为 单 侧 检验 { 单 尾 
检验 ); 若 五 ;未 指出 预定 方向 ,如 己 ) :天 向 , 则 为 双 侧 检验 ( 双 尾 
检验 ). 图 1. 1 a = 0. 05 的 单 侧 检验 否定 域 ,图 1.2 是 w = 0.05 
的 双 侧 和 检验 否定 域 ,可 以 看 出 ,对 于 同一 显著 性 水 平 o. 两 种 否定 
域 的 位 置 不 同 ,但 总 的 大 小 并 没有 什么 不 同 ， 

在 进行 统计 检验 时 , 若 根据 样本 数据 计算 的 统计 量 数值 落 入 
否定 域 , 则 认为 零 假设 H, 不 成 立 , MEE EE HEKE a 下 拒绝 
Hos GMA ATI H, 成 立 , 称 作 在 显著 性 水 平 g 下 不 能 拒绝 
Ho. 


Hil r= 0.05 的 单 俩 检验 图 1.2 2=0.05 的 双手 检验 
TER 否定 域 
三 , 非 参 数 统 计 方 法 


(一 ) 参数 统计 和 非 参 数 统计 


第 二 章 ” 单 样 本 非 参数 检验 


单 样 本 非 参 数 统计 方法 是 用 米 检验 只 需 抽 取 一 个 样本 的 假 
设 .通常 能 回答 下 面 的 问题 :观察 频数 各 某 种 原则 下 的 期 望 频 数 是 
Ay Aa Se Se EF ;观察 的 比例 与 所 期 望 的 比例 是 否 有 显著 差异 :样本 
取 自 某 种 类 型 的 总 体 的 假定 是 否 台 理 等 等 . 单 伴 本 非 参数 检验 通 
A TIA, 


$2.1 检验 


入 检验 CChi-Sqauare Goodness-of-Fit Test) 属于 拟 合 优 度 检 
验 , 它 可 以 用 来 恰 验 样本 内 每 一 上 类别 的 实际 观察 数目 与 某 种 条 件 
下 的 理论 期 望 数目 是 咨 有 显著 差异 。 1 


一 ,基本 方法 


霹 一 个 事件 只 有 两 个 可 能 的 结果 ,如 产品 或 合格 或 不 合格 ,对 
Aie 房改 方案 或 网 成 或 反对 ,那么 通常 可 以 用 参数 检验 的 方法 判定 
其 观察 频数 是 否 显 著 地 背离 期 望 频数 。 但 当 一 个 事件 可 能 有 两 个 
以 上 ,如 此 个 结果 出 现时 ,采用 x 核验 是 最 适合 的 . 若 样本 分 为 到 
AS. EA otro EPA A BA 


21. seas MAHE @ 可 以 测度 观察 频数 与 期 望 频 类 之 间 的 差 
IA, 
Q= 5 re (2.1) 


1—1 


RER E m BABA. AQ = 0, XJ 
(2.1) 式 中 分 子 的 每 一 项 都 必须 是 AIR & BAI 
频数 与 期 望 频数 完全 -… 样 , 即 完全 拟 合 .@ 统计 量 可 以 用 来 测度 实 
际 观察 频数 与 理论 期 望 频数 之 间 的 紧密 程度 即 拟 合 程度 ， 
寿 零 假设 为 观察 频数 充分 地 接近 期 望 闫 数 , 即 对 于 一 1,2， 
10 


…, 上 ,了 与 2, 元 显著 差异 , 则 由 于 样本 容量 充分 大 时 ,@ 统 计量 近 
亿 地 服从 和 白 由 度 持 二 万 一 1 的 六 分 布 ,因而 ,可 以 根据 给 定 的 显 车 


EXT EHR D PEA LAN AAA A 一 1), GQ CR 


一 1), WE% i; 否则 不 能 拒绝 Ho. 
二 ,应 用 


检验 运用 的 领域 很 多 ， He DE PEAS PLR ATA ERR 
FEJL. 

1. HAS Eu dere 5] 65 d 

24 f E A HC 49] 23 EUA AA A B np hl d e 
deter de xq BUE Rom REX? Ru Be TER 

[412.17 某 企 业 大 批量 连 继 生产 某 产品 , 要求 不 合格 品 率 
不 大 于 5 多 。 现 风 产 品 总 体 中 , 拍 取 100 个 进行 检查 ,不 合格 品 有 
12 个 , 试 以 5 多 的 显著 性 水 平 检验 该 批 产 品 的 不 合格 品 率 是 否 为 
575, 

分 析 LESER IAE PH AH ER DA 5% 这 一 已 知 比 
例 , 关 此 是 双 雇 检验 .建立 假设 组 为 

Ho: P=0.05 
Hi: PX%0.05 
在 这 批 产 品 中 期 望 的 不 合格 品 数 为 100 x 0.05 = 5, f E 
SUR S 95, BB f, = 12,f, = 88,€, = 5,5 = 95, TÉ B (2. 1) H 
算 的 @ 统 计量 为 ， 
Q = (12 — 5)*/5 + (88 — 95)2/95 
— 10. 316 

根据 显著 性 水 平 s 一 各 95, 自 由 度 47 =k—1=1, EX 4% 
表 ( 附 表 10.18 80 as = 3.841. HF Q = 10:316 > Ya = 
3. 841, 则 拒绝 H, AEE 5 名 的 显著 性 水 平 上 ,不 能 认为 该 批 

品 合 格 率 为 95 多, 即 不 合格 品 率 为 5 匈 。 
如 果 样 本 一 开始 分 类 就 为 两 类 , 而 其 中 一 类 的 期 望 频数 小 于 
11 
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5; 那 么 最 好 不 用 XC MAA 

2. He We AF Cte Pe] i E 

很 多 的 现象 之 间 往 往 会 表现 为 某 种 比例 关系 ,例如 对 同一 种 
疾 疾 ;不同 药物 治 盖 的 比率 ,不 同类 型 贷款 的 偿还 比率 等 等 , 沟 了 
检验 其 种 预期 的 比例 是 否 成 立 , 可 以 采用 她 检 验 。 

[442.2] FERIAREN A,B,C D 四 种 ， 
FFFA ERA 80% 12% 7% A1% TE a Be 
sx HA BRAT A 380 BAA 69%, C PUB 43%, DHA 
SEE 5% 显著 性 水 平 上 ,这 些 结果 与 预期 的 是 否 一 致 。 

分 析 : 这 个 问题 属于 要 检验 每 一 类 型 的 出 现 概率 与 预期 概率 
是 否 相等 , 即 

Hi: P,= P, 对 于 一 切 1 = 1,20, 
Hi; PSP, 对 于 一 些 ; 1,2 mk 

HP, + Por +P=1 
EMIKE X 检验 ,通过 实际 观察 频数 与 理论 期 望 频数 是 否 有 显 
著 差 异 作出 判断 。 

Ha A:B:C1D 类 型 偿还 贷款 的 标准 比率 为 
80:12:17141 
Hy; REMATE ER 

在 观察 的 已 偿还 的 500 笔 贷款 中 ,4 的 预期 仅 还 数 为 500 x 
0. 8 = 400, 其 它 的 以 此 类 推 . 表 2 一 1 给 出 了 计算 久 统 计 音 的 过 程 
及 结果 ，。 | 


m2—1 Q ftir E 
E 型 F e fi —e, (e)? Cfi — eO fe: 
A 380 400 - 20 400 1.00 
E 69 . 60 9 #1 l. 35 
C 43 35 & 64 1.83 
IL 8 5 3 9 1.80 
A dp 500 ^ 300  . — — E 8800 —— 300 OT 
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恨 据 给 定 的 显著 性 水 平 = 0.05, 自 由 度 df 二 一 1 二 4 一 

1= 3) EX oA ARE Mos 一 7.82, 由 于 
Q = 5. 98 <0 X e = 7. 82 

表明 在 5 多 I) i EK ABE 五 。 即 观察 比例 与 期 望 
比例 很 为 一 致 。 

六 检验 也 可 以 这 样 来 判定 :根据 自由 度 df 和 计算 的 妨 值 ,在 
X* 分 布 表 上 找到 A, MICA EK POP 等 于 或 小 于 a, 则 拒绝 
Ay, 否则 不 能 拒绝 豆 ,. 俩 2.2 中 ,根据 df 二 3,Q 二 5.98, 查 浪 分 布 
E.Q P = 0. 20 fi P = 0.10 所 对 应 的 4.64 与 6.25 二 者 之 . 
BE, 4F2P=0.10>a= 0.05, PREE Ho. 

HAZ DIA ES, = n Be, = n.n 为 样本 容量 即 各 类 观察 
频数 之 和 ,因而 可 以 变形 为 ， 

Q= Ee -a) + Ga e 


+ 
rel €; €i ez 
Sa BY fi, fi, y 
€, d € €; 
AC tee + A) 
P 
= Z file, — HA (2. 2) 


其 中 ,e 一 AP es Pic 为 理论 期 望 概 率 。 

[52.3] 续 例 2.2 由 于 在 例 2.2 中 忆 类 的 期 望 上 闫 数 等 于 
5 , 较 小 , 则 应 与 邻近 的 燃 别 合并 (必须 保证 合并 是 合理 的 ) ,从 而 减 
小 站 倩 而 增加 某 些 类 别 的 。 值 . 车 将 C 与 类 合并 , 则 A、.8.C 和 
DD 预期 的 概 尝 分 别 为 0,8,0.12.0.08。 根 据 观 察 的 结果 ,能 否 在 
5% 的 显著 水 平 上 ,作出 结论 。 

分 析 : Ho; P: = Pa 对 于 一 切 7 = 1,2,3 

H, P.APa 对 于 一 些 ; 一 1,2,3 

名 统计 量 利用 《2. 2) 式 计算 .过 程 如 家 2 一 2。 

根据 给 定 的 显著 性 水 平 = 0.05,df = 2, Æ Y! 4dg de fo 
X$.« = 5. 99, H FQ = 5. 375 < Xio = 5. 99, 3E BH E 5 05 AY EE 
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水 平 上 不 能 拒绝 Ho. 


sk 2-2 怠 统 计量 计算 表 
aa nm fi Pn e, = 2P ip f? Fife. 
A 380 3. BO 400 144400 361. 
H 69 0, 12 60 4761 79. 35 
CRI P 31 D. og 40 2601 65.025 
= ++ 500 1. 00 500 — 505. 35 
Q — 505.375 — 500 一 5.375 dí=3-1=2 


有 时 ,预期 的 比率 不 一 定 表现 为 概率 形式 ,如 四 种 药物 对 同一 
种 疾病 的 有 效 比 率 为 9: 3:3:1。 这 时 ,可 以 将 其 转换 为 预期 概 
率 , 即 四 种 药物 的 期 望 有 效率 分 别 为 45,16， E 

3. Xe Be EX 38 7) X — 908 

ARE LAA ECCE D z1 ,zi,… KER IR 
数 未 知 的 某 一 连续 分 布 ,将 其 总 体 的 理论 分 布 记 作 Fotr), XER 
观察 数据 的 分 布 为 F(x) ,检验 总 体 是 否 为 某 一 特定 分 布 Poo) 的 
ERA: 

Ay: Fr) = Flr) XE BÉ E x 
Ay, FQ) + FQ) 对 -一些 工 
利用 尖 检验 可 以 作出 判定 。 

将 随机 抽取 的 样本 数据 分 为 组 (要 保证 每 组 的 期 望 频数 至 
少 是 5 否则 许 将 相 邻 组 合并 ) ,以 祥 本 参数 估计 值 作 为 总 人 笨 特定 
分 布 的 参数 值 (因为 是 大 样本 , 故 以 样本 慎 蔡 代 总 体 值 ) ,计算 每 一 
组 的 期 望 频 数 e; BELL (2.1) 式 计 算 久 统计 量 . 由 于 某 一 特定 分 布 
可 能 有 也 个 参数 是 固定 的 因而 已 统 计量 的 自由 度 


df = & — w — 1, fig e. df BL DAR. TASB 


H. WE R 2 一 3 RES AER PLI 9 e 


14 


表 2- 3 Hew UA pE SE 


分 布 Bb 数 tiit 8 w df 
Ln AE ld ES 
(RA 8 Ezt inaf | 下 一 卫 
泊 松 分 布 A z 1 & —2 
正 态 分 布 nmm FN 2 &--3 
指数 分 布 
For) =] e + 1/À fe 1 A —2 


[ 512.41 两 种 不 同 牌 号 的 茶叶 个 更 好 。 

今 有 30 人 组 成 的 品 茶 专家 组 ,对 4 下 两 种 不 同 牌 号 的 茶 进 行 
8 种 不 同 味道 的 检验 。 凡 专家 认为 优 者 被 记录 下 来 ,如 表 2 4 A 
癌 牌 号 的 茶 提 供给 专家 品尝 是 随机 的 。 

分 析 :两 种 不 同 牌 号 的 茶 中 ,4 被 选择 是 优 的 概率 ,可 视 为 二 
项 分 布 中 一 个 试验 成 功 的 概率 为 多 少 的 问题 .由 表 ?一 3 提供 的 方 
法 ,利用 表 2 一 4 的 数据 ,可 以 合计 二 项 分 布 中 的 参数 9, 即 一 个 试 
验 成 功 的 概率 ,这 里 就 是 4 被 选择 为 优 的 概率 ,因此 ,判断 4.B 茶 
哪个 更 好 ,实际 上 就 是 判断 表 2-~…4 的 样本 数据 是 否 来 自 参数 9 一 
La /nF 的 二 项 分 布 总 体 . 若 是 , 则 哪个 牌号 被 选 为 优 的 概率 越 
A BB ES BE ERE, 

Ay; Fi 为 二 项 分 布 
Hi FO 不 是 二 项 分 布 

由 于 对 任何 一 个 品尝 专家 来 说 ,4 牌号 都 能 被 选择 1 罕 6 次 ，. 
因此 , 按 AA 被 选择 的 次 数 整理 数据 ,得 到 丧 2 一 5。 其 中 ,zx 表 示 A4 被 
一 个 专家 选择 的 次 数 , 了 上 表示 相应 的 专家 人 数 ,在 这 个 问题 中 ,对 
茶叶 进行 6 个 味道 章 尝 检验 , 故 呈 = 6, 人 参数 8 的 估计 值 就 是 
ZErf/nEf = 117/180 = 0.65. d n = 6,0 = 0.65, HE X AT 
得 到 Po. A Ale = NPN = Ef 一 30) 计算 期 望 频数 ,可 以 将 实际 
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频数 了 与 期 望 频数 e 比较 ,采用 O ERAS E 
BGA RAB AMR Bit oS iss ae oR BEG 


服从 


T 
1 


I 分布,Q@ 统计 量 计算 过 程 如 表 2 一 6。 


ZH} 


专家 检验 茶叶 味道 结果 统计 表 


X 2-4 


A TEE 
的 次 数 
3 


6 
A 


el? jr 
= 

| 

er | 的 
= HR 
bs | 
sr] 


A 


B 


i9 
11 


12 
13 
14 
15 
16 
17 
18 
19 
20 


21 


22 


aa 


24 


25 


26 


2T 


28 


A 


29 


30 
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2-5 数据 整理 — — 
as mg 表 2 一 6 中 ,由 于 第 -一 一 ,三 组 的 期 
0 


O A mx 5, 因此 ,将 它们 合 


1 0 Hit RO = 0.2472, RED 
: eb kK a = 0.05. H AE dí = k 
4 10 — w—1=3 42 af RB es 
5 7 = 7. 82, AQ = 0.2472 Xin = 
6 


2 7. 82 ,所 以 不 能 拒绝 HL ADA, 


合计 30 


MEN# 工 可 知 , 有 95% 以 上 的 把 
握 支 持 这 批 数 据 来 自 一 个 二 项 分 布 的 假设 , 且 贿 数 8 估 计 值 为 
0. 65。 这 一 结果 表明 ,有 AA、B DERE B ZR HA 被 选择 是 优 的 鼎 
率 较 大 ,因此 ,专家 评价 结果 AREG. 


-—6 MESSI que E. 
x f rf Pg e = NP, fea (Fog Cf — eM fe 
9 0 性 D. 0013 0. 054 一 i. 522 
1 ü n 0. 9205 D. 515 ^ Bee n. 2725 ü. 0774 
2 3 B 0. 0951 2.853 
a 3 24 0.2355 7. 065 O. 035 D. 8742 D. 1237 
4- 10 40 n. 3280 5. 84 a. 16 th 0256 0.0026 
5 7 35 o. 2437 1. 311 — D. 311 0. 0967 0. 0132 
B 2 12 G. 0754 2. 282 一 Ü. 262 0. 0586 0. 0303 
30 117 1.0060 30 . D. 2472 


$2.2 Kolmogorov-Smirnov 检验 
Kolmogorov-Smirnov k fj 5j Jy K-S hik, AERAR ER BE 
BAP SS RRS. E PWG RE. Ee Ra 
本 数据 的 实际 分 布 与 某 一 指定 的 理论 分 布 间 相 符合 程度 的 问题 ， 
用 来 检验 所 获取 的 样本 数据 是 否 来 自 具有 某 一 理论 分 布 的 总 体 。 
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一 ,基本 方法 


K-S 榨 验 是 用 酚 个 修罗 斯 数学 家 的 名 子 命名 的 ,他 们 对 这 种 
非 参 数 统计 技术 的 发 展 作 出 了 贡献。 若 Sr) Xen T n KRU 
B BE AL AB fc RE BS ALS AS, Cx) = mi ESPE 
‘hx ARE ERE = 1 2er E O) 表示 一 个 特定 
EVA AAA. I, go TF FE x FP O 值 代表 小 
TFT r EA MA RAE AA. TF RT ELE X, SG) 
与 FIG 之 间 差 值 , 即 

D = |S,Cr) — Futr) | 
其 中 ,S,(z) HEAR EP O 为 理论 分 布 水 数 , 若 对 每 一 个 
BES A 5 FQGO 十 分 接近 ,也 就 是 差异 很 小 , 则 表明 经 验 
分 布 图 数 与 特定 分 布 函 数 的 拟 合 程度 很 高 ,有 理由 认为 样本 数据 
来 自 具 有 该 理论 分 布 的 总 体 。. 天 -3 检验 集中 考察 的 是 |S。.Cz) 一 
FO 中 那个 最 大 的 偏差 , 即 利用 统计 量 
D = max|S,Cr) — Flr) | (2. 3) 
TE AE 
K-S 检验 的 步骤 为 : 
建立 假说 : 
Ho S.) FG) AAA x 
Hi Six) FQ) 对 一 些 x 

计算 Rite: 

i D = max |S, lr} — Falz) | 

查找 临界 值 ;根据 给 定 的 显著 性 水 平 a, 样 本 数据 个 数 x, 查 附 
ze E 可 以 得 到 临界 值 OX REESE, 

fE HL DE 39 D « 4, 则 在 a 的 水 平 上 ,不 能 拒绝 玉 ,; 若 也 实 
des WE a 水平 上 ,拒绝 Ho. 


二 ,应 用 


在 许多 实际 问题 中 ,检验 确定 某 一 组 数据 是 否 来 自 菜 一 特定 
18 


tT Ever iG 9o E VDO - D «m e my Ua 1) 
经 这 计算 C= 1/1. 1908 + 0. 600062 + 0. 001146 + 0. 0000008) 
二 0. 8889, [X I, 46 期 ht 数理 统计 与 管理 》 的 论文 与 作者 数 的 理论 
党 特 卡 分 布 为 
FO) = 0. 8339/27 (2.6) 
为 了 判定 k 数 理 统计 与 管理 》 论 文 作 者 的 实际 分 布 是 否 与 理 
论 分 布 一 致 ,可 以 采用 天 -3 fou dtr B BOR DS 
Hy: S,(r) = FG) 对 所 有 r 
H, Sx) AFA) 对 一 些 x 
理论 累积 频率 FLO 的 各 个 秆 ,可 以 将 z 分 别 代入 (2, O 式 计 算得 
到 , 实 慰 周 积 频率 是 将 累计 的 作者 数 Ey 分 别 除 以 作者 总 人 数 得 
到 。 计 算 结 果 , 作 者 实际 累积 频率 及 理论 累积 频率 及 各 个 差 值 如 中 
2- 一 8 。 
表 :2 一 8 TER SC RE Se REUS 


x I 2 3 4 5 6 7 
Fata) 0.8389 0.9398 0.9690 0.9811 0.9872 0.9907 0.9928 
S, 0.8932 0.9635 0.9870 0.9898 0.9922 C.9948 1.0000 

|S.G) — FyCe}[ 0.0643 0.0237 0.0180 0.0085 0.0050 0.0041 0. 0071 

i 
D = max|lS, o — Fito)! 
= 0. 0543 


根据 显著 性 水 平一 0.01, FEAR n = Xy = 384, ERE 
OT BPG d. = 1.63/ Y n =1.63/ 4384 = 0.0832. H F n l 
> 45, 为 大 样本 , 故 应 选取 附 表 可 PAGAN ARE E 
界 值 .显然 ， 
D = 0. 0543 « d, = 0.0832 
因此 ,数据 在 1 多 的 显著 性 水 平 上 不 能 拒绝 E EEK a 
90. 95, 查 附 表 下, 得 到 临界 值 4 二 1.36/ n = 1.36/ w384 = 
20 


0. 0694, li 
D = 0.0543 « d, = 0. 0694 

[S 此 ,数据 在 5452 的 显著 性 水 平 上 也 不 能 拒绝 IE AV XOR 
理 统 计 与 管理 作者 的 分 布 腿 从 洛 特 卡 分 布 。 

【 例 2.61 公共 交通 设施 适合 性 的 研究 一 一 公共 汽车 到 达 
时 间 是 否 服从 正 态 分 布 

公共 汽车 按 计 划 每 15 分 钟 通过 一 个 商店 旁 ,然而 ,由 于 交通 
条 件 , 习 客 数量 等 的 影响 ,汽车 实际 到 达 的 时 间 有 很 大 不 同 .通过 
一 天 随机 的 观察 ,获得 的 数据 如 表 2 一 9。 比 计划 提前 到 达 的 为 负 
和 值 , 取 大 的 整数 ,如 提前 1 分 10 秘 到 达 % 记 作 一 1; 比 计划 晚 有 的 为 
正 值 ,也 取 大 的 整数 ,如 壕 到 工分 10 秒 , 记 作 十 2. 公 共 汽 车 到 达 时 
闻 是 否 服从 = = 3 的 正 态 分 布 。 
家 2--9 ERAN THE 
HEE CI) 
观测 频率 (站) 


分 析 ; 正 态 分布 是 一 个 常用 的 概率 模型 ,如 果 公 共 汽 车 到 达 
时 间 被 证 明 是 服从 正 态 分 布 , 就 为 进一步 的 研究 提供 了 一 个 方便 
使 用 的 模型 .这 里 FP O JÉRUBUMIE d AR ER EL. AWEBIES 
的 ,因此 使 用 K-S 检验 是 合适 的 。 

Ha S.) = Fix) 对 所 有 
Ha Sa) AF) Ree 

这 里 F(x) 是 标准 正 态 分 布 钙 (Z)， 

为 了 得 到 Foo) = 0), ERE &; 它 的 最 好 估计 秆 是 样本 
IQR aa = 3rf/23f = 1.6, 借 助 于 Z = (x 一 pg)/o 和 将 数据 标 淮 
化 ,计算 过 程 如 表 2- 一 10, 表 中 Z 的 概率 一 列 , 是 根据 Z 的 绝对 值 村 
HERE Ww 得 到 的 。 . 

FG) = OZ) 一 列 的 数值 是 依据 2Z M RBS TZ od 
GE. OZ) 就 是 2Z 的 概率 , 若 2 E 0D 是 1 减 去 2 的 报 


Zt 


fA TEAS EE BUR AX — 13] AIO (LE CE 
ta gon. 


Bé 2— 11 刀 的 计算 表 

a CES Fa} (S, (a) — Fata}! 

mE E 9. 0500 ES 0148 D. 0361 

- 3 Q. 1049 n. G30 0. 0370 

=1 o. 2000 Y 1922 0. 9078 

Ü 0, 2500 J. 2981 O. 0481 

1 O. 5000 EFI 0. 0793 

z 0. 7300 J. 5517 0. 1953 

4 O. 9000 6.7881 0.1119 

7 o. 9500 D. 9641 0.0141 

8 1. 0000 o. 8843 0. 0166 


三 .XX 检验 与 天 -S 检验 


XU Ra g K-S hay AMES AY RRA Fe 
REO BBS K-S 检验 还 用 于 定 序 尺度 测量 数据 。 当 预期 频 教 较 
AO 丛 验 常 需 合 并 邻近 的 类 别 才能 计算 ,天 -8 检验 则 不 需要 ， 
FIRS BELL 信 检验 保留 更 多 的 信息 ,对 于 特别 小 的 样本 数 自 ,X 
检验 不 能 应 用 ,而 天 -S 检验 则 不 受 限 制 。 因 AIE, K-S 检验 的 功效 比 
检验 要 更 强 。 


$2.3. 符号 检验 
符号 检验 (Sign Test) EAH E, HERY 目 对 某 种 假设 作出 
判定 的 非 参 数 统 汁 方法 。 
一 ,普通 的 符号 检验 


1. 基 本 方法 
如 果 所 研究 的 问题 ,可 以 看 作 是 只 有 两 种 可 能 ,* 成 功 ” mb ue 
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E FER AIR EA IA LA 十 表示 成 
Jj. 一 表示 失败 ,那么 随机 抽取 的 样本 就 有 两 个 参数 :成 功 的 概率 
P, ,失败 的 概率 己 - .这 样 , 就 可 以 构造 一 个 假设 ， 
Hy: P,=P 
Hi, P ÆP. 
XX EM Bor dee OE SS PE UU II, 来 说 ,不 要 求 P GAT P4 
ES P. 比较 大 还 是 P 比较 大 , 则 需 用 
单 侧 备 择 假设 , 即 
FH. P=P. Ha P= P 
Ha: PP. Ho. PL<P_ 
RE H, En P, AERAR A 被 用 来 说 明 Po 是 比较 大 的 。 
为 了 检验 上 面 的 假设 ,普通 的 符号 检验 所 定义 的 检验 统计 量 
AS, 和 和 5-。S+ 表示 为 正 符号 的 数 自 ,S. 表示 为 负 符 号 的 数目 ， 
S + S- sa 2. PASHARA., 
要 对 假设 作出 判定 ,需要 找到 一 个 已 值 .因为 对 于 S+-. 和 3_ 来 
说 ,质料 分 布 是 一 个 勤 有 8 = 0.50 表示 成 功 的 概率 ) 的 二 项 式 分 
布 , 所 以 如 果 H, 为 真 ,从 附 表 VI 中 能 够 根据 nS. 或 5_ EAP 
E£ P ERU, AW A, 为 真 的 可 能 性 很 小 ,数据 不 支持 Bo MA 
BH, | 
当 样 本 的 观察 数据 = < 20 Ib. BTPURIRI Er Zr ERA P (ife 
出 判定 . 若 样本 的 观察 数据 # > 20, 可 以 用 正 态 近似 办 法 ,根据 
(2.7) 式 计算 Z 值 ,查找 附 表 N ASAAN P. 


- | | (2.7) 


AAA EH eT LS se 212. 

2. 应 用 

在 实际 问题 的 研究 中 ,常常 会 过 到 难以 用 数值 确切 表达 的 问 
24 l - 


ERP SRA RIA RSAC RI” icr SL Rik 

Ha P= P 

Hi: PLAP_ 
ix — BERNA ERE RKRRA A. BAAR Sy = 
12,5_=2,n=14, EE Von = 1404.5, E S mp S,— 12 
HERRN 2 fede 2x 0.0065 = 0.0130, BAP = 0.0130 fh, 
以 显著 性 水 平 e = 0.05,P RE; elo HE hack A BE 
对 咖啡 和 条 的 喜爱 有 显著 差异 .判断 是 香 更 喜欢 茶 ,建立 单 侧 备 择 
假设 

Hy. P,=P_ 

Hy, P> P 
RAEE AY 143.— 12 时 , 附 表 VI BRM P di o 
0. 0065. 对 于 a 一 0.01, 己 值 也 足够 小 , 故 数 据 不 支持 五 ,而 支持 
H, 。 磊 客 在 咖啡 和 茶 中 更 喜欢 茶 。 


二 、 位 置 的 符号 检验 


1. 基本 方法 ， 
一 个 随机 抽取 的 样本 ,有 个 数据 zx, 12 tx, ARE E 
” 体 中 位 数 记 作 ,假定 的 中 位 数 是 某 个 特定 值 , 记 作 Me。 若 研究 问 
题 时 关心 的 是 :真实 的 中 位 数 对 是否 不 同 于 M。, 可 以 建立 假设 

Ha M=M, 

AL; MAM, 
如 果 关 心 的 是 ;真实 的 中 位 数 ML 是 否 太 于 或 小 于 特定 的 数 Mo 
REgit vr 8 OU PRR 

Ho: M=M, Ho; M=M, 

He: MM, FH. MM, 
LEX EE FEMA FE MS t JUE :至少 是 定 距 尺度 测量 ,车 
定 序 尺 度 测 量 的 ,应 能 与 4, 相 比 并 决定 大 小 次 序 ,也 就 是 说 ,数据 
EM, 比较 的 结果 能 用 “十 ” 或 “一 ” 表示 , 设 定 Ls a Æ M, 
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附近 是 连续 的 , 则 普通 的 符号 检验 方法 可 以 应 用 。 这 就 是 符号 检验 
法 用 于 单 样本 位 置 的 推 部 ， 

检验 统计 量 . 位 置 的 符 导 检验 折 定 义 的 检验 统计 量 也 是 S+ 和 
S.S 表示 每 -- 个 观察 数据 zx (f= 1,2000 与 特定 的 数 M. ME 
值 已 一 过 一 ad 的 符号 为 正 的 数 日 ,93- 表示 D. 符号 为 负 的 数目 。 
Sit S. nun RRASH SAME. 

PAS. H ns 20 时 ,与 普通 的 符号 检验 一 样 ,从 附 表 WI 
中 查找 ;车 > 20, 由 正 态 近似 得 到 卫 值 ,在 附 表 W 中 查找 。 

2. 应 用 

[412.10 生产 过 程 是 将 需 要 调整 

某 企业 生产 一 种 钢管 ,规定 长 度 的 中 位 数 是 10 米 。 现 随机 好 
从 正在 生产 的 生产 线 上 选取 10 根 进行 测量 , 辣 果 为 ， 

9. 8,10. 1,9. 7,9. 9,0. 8,10. 0.9. 7,10.0,9. 9,9. 8, 

4r tr HP BORIS T TREE BP AO — ML 3 ECL PEE 
度 真正 的 中 位 数 大 于 或 小 于 10 米 , 则 生产 过 程 需要 调整 .这 是 一 
个 双 侧 检验 ,应 建 立 假 设 

Ho: M=M,=10 
H: MM. | 

为 了 对 假设 作出 判定 ,和 洁 要 得 到 检验 统计 量 3+ ,93_ .将 调查 
得 到 数据 分 别 与 10 比较 ,算出 各 个 符号 的 数目 ;S+ 一 1,S..= 7.n 
= BBD, = OAS ATH) FERNS MIP = 8,59, ES. HEAR 
7 的 右 尾 概率 的 2 倍 是 2 X 0.0352 = 0. 0704. 若 显著 性 水 平 “一 
0.05,P 已 是 够 大 ,表明 调查 数据 支持 五 。。 根 据 这 批 数据 ,生产 过 
程 暂 不 需 做 调整 。 

3. 配 对 样本 位 置 前 符号 检验 

作为 单 样 本位 置 的 符号 检验 ,也 能 够 应 用 于 配对 禅 本。 随 机 选 
RRA n 个 数据 对 ENTES DE E EDRTEREM 
DARE FRE ARA BCE. KET M, 
都 是 定 序 尺 上 度 , 因 为 ,为 利用 符号 检验 ,至 少 要 求 每 对 数据 的 差 值 
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D, = 2, — y, HF M: SEU BBE RT ELTWI E B E 2 HE HIC M, 
bet UT AA HE SED. Mo 表示 随机 变量 的 数 对 之 闻 差 值 DD, ++ D, 
AAA YM, AAA MANE AAA RR E 
HM y My ER LAA AE S EH HR 
Hy: Mp =M, f 
Hi, M: =M, 

Ho: Mp = M, Ho: Mo = M, 

Ho. MM, Ha M¿<M, 
配对 样本 的 方法 同 单 样本 位 置 的 符号 检验 方法 一 样 ,检验 统计 量 
也 是 54,5- 。 但 是 ,S+ RH D. 5 M. MES ERE, 
S. RD, —M ff TRES RID; 一 = 六 一 六 一 本 .和 以 前 
一 样 , 着 D, 一 M, = 0; 则 nn 中 不 计 , 判 定 假 设 的 和 值 仍 在 附 表 Y 
中 , 按 以 前 那样 查找. 若 n > 20,10 ERAT S.S RRO. SD 式 计算 
zZ, 在 附 表 WN 中 查找 相应 的 产值 。 

[592.11]. 领导 者 的 领导 水 平 是 可 以 训练 的 

为 验证 领导 水 平 是 可 以 训练 的 ,根据 人 的 聪明 程度 .人 品 、 受 
教育 状况 等 ,随机 抽 选 出 12 个 人 配 成 6 对 ,每 对 中 有 一 人 随机 选 
择 受 训 , 记 作 工 , 另 一 人 则 不 受训 记 作 CC, 经 过 一 段 时 间 后 , 按 被 设 
计 好 的 问题 评价 他 们 的 领导 水 平 , 结 果 如 表 2 一 14。 

X 2 一 14 Be RS EA HF ff FE 
Bic Sate as Het A. 的 评价 tr C 的 评价 (3 TI y 


1 13 10 +: 
2 19 7 + 
3 34 20 T 
4 24 38 — 
5 40 22 + 
6 39 15 + 


分 析 : 表 中 的 分 数 并 不 是 精确 测量 的 结果 , 它 只 是 相对 的 领 
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导 能 力 比较 . 它 没有 一 个 精确 的 量 的 意义 ,而 是 一 对 中 两 人 比较 ， 
反映 领导 水 平 差 异性 的 符号 。 如 果 领 导 水 平 是 可 以 训练 的 ,那么 接 
受 特定 训练 的 成 员 诬 该 比 那些 配对 的 非 受 训 人 员 有 较 高 的 分 数 ， 
内 此 备 择 是 单 侧 的 。 合 适 的 假设 为 l 
Ho: Mp=0 
Hi: Mp 70 
由 表 2 一 14 给 出 的 数据 可 知 ,S+ 一 5,3_ = 1,n = 6, ER VI 
中 查找 的 准确 已 值 为 一 6,5+ 一 5 的 右 尾 概 率 , 即 已 一 0,1094。 
对 于 显著 性 水 平 & 一 0.05, 显然 已 是 够 大 的 .因此 这 批 数据 支持 
Ay, ASE 五 +, 即 这 批 数 据 不 足以 说 明 领 导 水 于 是 可 以 训练 的 ， 
[412.121 人 的 智商 是 否 随 出 生 顺 序 而 升 高 
通过 对 以 往 在 校 学 生 的 调查 发 现 , 智 南 往 往 贬 着 出 生 顺 序 而 
升 商 ,这 种 关系 在 成 年 人 中 是 否 也 存在 ?通过 随机 选取 13 对 成 人 
的 同 驳 兄弟 姐妹 进行 调查 ,得 到 智商 的 数值 如 表 2 一 15。 


3€ 2 一 15 配对 样本 智商 值 统计 衣 
SHR EA A) ee a O) (2 — y 的 符号 
HB B2 + 


$0 94 


& 
LE d E d d d LB a gd gl 


104 168 


分 析 : 如 果 成 年 人 的 智商 与 出 生 顺 序 有 美 ,并 与 孩子 的 规律 
相同 ,那么 冻 一 胎 出 生 的 人 的 智商 值 应 该 比 自己 的 其 他 兄弟 姐妹 
低 , 因 此 应 建立 单 侧 备 择 假 设 , 差 值 也, 二 x 一 y, 是 第 一 胎 的 智商 
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ÉRA res EA ARA E T TEE FDO ARANA 
商 值 无 差异 ,也 就 是 智商 值 差 值 的 中 位 数 M = 0。 这 是 一 个 配对 
样本 位 置 的 符号 翌 验 .建立 在 差 值 中 位 数 基 础 上 的 假设 为 

Ho; Mp=0 

Ho. Mp< 0 

由 表 2 一 15 OHS, 二 2,S_ 二 11,n 一 113, 在 附 表 中 相对 于 

3 一 1I3.S_ 一 1]1 的 右 尾 概率 是 0. 0112 ,这 是 准确 的 产值. 对 于 显著 
性 水 平 a = 0.05, 己 值 要 小 得 多 。 这 意味 着 ,对 于 那些 差 值 的 中 位 
数 为 60 的 随机 变量 ,在 13 个 符 导 中 ,有 11 个 是 负 号 的 情况 极 少 出 
现 , 因 而 数据 不 支持 HH, ,而 支持 H. .这 表明 对 于 成 年 人 来 说 ,出 
生 硕 序 仍 然 对 智商 有 影响 ,智商 随 着 出 生 顺 序 而 增高 。 


三 .中 位 数 的 置信 区 间 


符号 检 验 的 统计 方法 可 以 用 来 估计 单 样 本 总 体 中 位 数 的 置信 
KA ,配对 样本 差 值 总 体 中 位 数 的 置信 区 闻 。 

1. 顺序 统计 量 

Ny FEE LER (Order Statistic) 亦 称 次 序 统 计量 , 它 在 非 参数 统 
计 中 有 很 多 的 应 用 .假设 XX X. 是 抽 自 连续 总 体 的 一 组 随 
机 变量 样本 数据 , 按 其 大 小 顺序 由 小 到 大 依次 排列 ,并 引入 一 个 带 
括号 的 下 标 表示 其 排列 的 位 置 , 如 Xo 表示 在 = 个 数据 中 的 第 > 
个 , 则 它 是 来 自 于 从 最 小 开始 排列 的 第 7 个 数 ,类 似 的 ;可 以 将 样 
本 数据 AA X, 依次 排列 为 

Xa LX Li LX 

这 就 是 顺序 统计 量 , 是 原 有 样本 数据 按 逐 渐 升 高 的 顺序 排列 的 .这 
HB ar 5,38. Xo, « X 只 是 表明 它们 以 什么 样 的 顺序 被 观 
察 , 按 从 小 到 大 的 顺序 Xo CEH Xi 在 后 ,至 于 它们 的 相对 数值 
大 少 是 多 少 并 没有 意义 .顺序 统计 量 没有 与 原 有 变量 相同 的 概率 
王 煞 , 即 使 原 变量 是 独立 的 ,顺序 统计 量 事实 上 可 能 不 独立 ， 

Z. d. 4& A I8 
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El 

Xiao S M x Xu 
在 顺序 统计 量 中 ,处 于 第 3 个 位 置 的 数值 是 9.8, 处 于 第 8 个 位 置 
的 是 10.8,. 因 此 ,中 位 数 的 89.06% Efa EE 

9.8 « M «c 10.0 
志 就 是 说 ,可 以 有 近 90% 的 把 所 .钢管 的 中 位 数 处 在 9. 8 KB 10 
KZ. [8] 

XT PAE BU Fer diy 24€, MAR MAA AAA) ELO 
ERRAT ACA MEA Y 中 查找 站 时 ,已 不 是 (1 一 /2, 而 是 1 
一 了 .例如 对 应 于 单 侧 检验 AM «M, feit MS Xun 的 95 Yo 
置信 区 间 , 根 据 = 0.95.1 —r 0. 05,2 = 10, EHE 村, 得 到 与 
P = 0. 0547 相应 的 ,5+ HARRAH 2, Bl 5 Y — 0. 9453 对 应 的 
k= QUSE HET MS 9. 8 A BRR BA 94. 537% o FE 
侧 检验 A, 1M > M, Wik ib M x Xu 的 95% 置信 区 间 , 在 
EI M 中 ,根据 PP 二 1—7-—20.05.2 = 10. HR ,由 于 在 表 212 
中 与 单 侧 检 验 五 + 相对 应 的 是 S_ 的 左 属 概率 ,所 以 上 一 2, 即 好 的 
94.53% 的 置信 区 间 为 M x Xan. 5 RAE M x: 10.0, 


` 二 项 式 检验 和 分 位 数 检验 


1. — 5 A dr X 

在 实际 问题 中 ,有 许多 总 体 可 以 划分 为 两 类 ,如 将 人 分 为 男性 
和 女性 ,学 者 和 非 学 者 ;对 患 同一 种 病 的 人 某 种 药物 起 作用 还 是 不 
起 作用 等 等 ,这 是 可 以 分 作 两 类 的 总 体 , 也 称 为 二 项 总 体 ,普通 的 
符号 检验 可 以 用 于 来 自任 何 二 项 总 体 的 样本 数据 .着 所 是 一 个 指 
定 的 数值 ,0 << 1, 那么 可 以 采用 符号 检验 ,判定 某 一 些 数 据 是 
TAB MDI? 概率 8 — 所 的 二 项 总 体 , 建 立 的 双 侧 假设 检验 为 


Ho: 8 = By 
E. 0D, 
单 侧 检 验 为 
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Ay: 08 — 0, Ha =t, 
Hi: @> 4, H.. 8-8, 

随 PLUS EZECH CA n BY n 1K THe IUE: E AR 
互 比较 的 数组 ,都 可 以 考虑 应 用 符 导 检验 判定 是 否 来 自 带 有 参数 
9。 的 二 项 总 体 , 在 这 个 数据 中 ,每 次 观察 都 被 分 为 成 功 或 失效 ， 
作为 成 功 的 概率 是 品 .s+ 表示 成 功 的 数目 ,S- 表示 失败 的 数目 。 
fk H , FAR ,成 功 的 期 望 数目 是 ngu, 失 败 的 数目 是 ml — 00.8, 
REM TAS 4, ALAS. 是 带 有 参数 1 一 名 的 二 项 分 布 
《注意 :名 一 1 一 负 只 有 且 仅 当 负 二 0.5 时 成 立 ,通常 傅 况 下 ,SS 和 
S. 不 是 同样 分 布 )。 

Sa 和 5- 被 作为 检验 统计 量 . 对 于 任何 的 名 , 当 S. 比 它 期 望 
AYE nt KGS, Be S 远 远 地 小 于 n, Et, Wl) Ez. 被 
SERE MTAAM SRB e RECS 
结 如 表 2 一 16。 本 书 中 附 表 T 是 左 尾 概率 ,因而 常用 表 2 一 17 提供 
的 检验 统计 量 查找 。 


25216 KAR de FUzE JE ERG 

e BEBE PH CE 
Hi, 86, HH Oo WY Sy 右 尾 概率 

Ho: BAS WA 0 YS. BAC 

Hi: 04% HE BS. DAMA 218 
Aa: 0>8, TH 1— AS. ARR 
Ho. 068 带 有 1 一 加 的 8- HARAR 
Hi: 88 "UR 1 — BS ARRE 2 48 


El ERES < 20 BEI an > 20 时 ,可 以 采用 正 态 近似 解 
决 ,用 (2.9) 式 先 计 算 ZI aZ uas 统计 量 , 再 查 附 表 NW ,作出 判定 。 
R 2 一 18 是 当 nn > 20 时 的 判定 指导 表 。 
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$% 2-17 MAS A ries 


备 择 假 设 PIE HH 1) 
(Ha. 8m RAS FREE 
Ho. 88, HA 0. B3 S. ARA 
Hi: 6356 带 有 全 的 S+, 带 有 1 一 名 的 S- DBR 2 f 
Z, A nA z = S279 50 = f) 0. 9) 
V nfo — 8 V n8, — 8) 
% 2-18 二 项 式 检验 判定 指导 站 
ERR P( (HËNN) 
Hi; @> 6 24.0 41 E: 
Hoi; 60, 2 之- EE ERE 
Hi: Oz By Zea H Z-a KEG REA 2 fi 


[552.141 商场 晚上 是 否 应 延长 营业 
ATAR 6 + 30 关 门 .有 人 建议 应 延长 普 业 时 间 至 10 + 00, 
为 作出 闫 定 , 现 欲 对 商场 周围 顾客 情况 作 一 调查 , 若 商场 的 经 常 性 
顾客 有 25% 以 上 说 延长 营业 将 去 购买 商品 , 则 延长 营业 时 间 值 
得 .随机 选取 50 个 家 庭 ,发 现 只 有 18 个 能 够 被 认为 是 商场 的 经 常 
”性 顾客 ,调查 结果 ,有 ? 个 家 庭 表示 ,延长 营业 时 间 将 可 能 去 购买 ， 
分 析 :这 个 问题 可 以 看 作 一 个 两 分 类 总 体 ,延长 营业 瑞 客 去 商 
场 购买 定义 为 成 功 , 需 要 调查 数据 支持 这 样 一 个 结论 ;成 功 的 概率 
超过 25% ,因此 ,合适 的 假设 组 为 | 
Hy: 日 一 0.25 
Hi: 070.25 
由 调查 的 结果 可 知 ,8+ 一 7;3_= 11,n = 18,28 TO = 1 — 8, 
—1-— 6.25 = 0. 75,8 .二 11.P HA 0.1390, 1X —ZS TR SE HB, ig 
RIK a = 0.05, 卫 值 是 足够 大 的 , 即 8 = 0. 25 不 是 小 概率 事件 ， 
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而 是 有 足够 六 的 概率 发 生 . 因 此 ,数据 支持 Ho 也 就 是 这 些 调 查 数 
据 不 足以 支持 延长 营业 时 间 的 假设 。 

2. 分 位 数 检 验 

对 于 定 序 尺度 测量 的 数据 ,描述 其 分 散 程 度 的 指标 是 分 位 数 。 
常用 的 有 百 分 位 数 , 十 分 位 数 和 四 分 位 数 . 特 顺序 统计 量 分 为 四 等 
分 ,每 一 等 分 内 含有 样本 总 数 的 25 PRUE ESA SAB 
一 个 ,第 二 个 、 第 三 个 四 分 位 点 ,与 之 相应 的 数值 分 别 是 第 一 个 ,第 
二 个 .第 三 个 四 分 位 数 ,以 尽 表 示 ,将 顺序 统计 量 分 为 十 等 分 ,每 等 
分 内 包含 样本 总 数 的 10% 个 样本 数据 ,分 割 点 称 为 第 一 个 .第 二 
个 …, 第 九 个 十 分 位 点 ,与 之 相对 应 的 数值 就 是 第 一 个 ,第 二 个 、 
一 第 九 个 十 分 位 数 , 世 可 以 已 表示 ,将 顺序 统计 量 分 为 一 百 等 分 ， 
每 等 分 内 包含 样本 数据 总 数 的 1% 个 数据 ,这 些 分 割 点 称 为 第 一 
个 .第 二 个 、-…, 第 九 十 九 个 百 分 和 位 点 ,与 之 相对 应 的 数值 分 别 是 第 
一 个 .第 二 个 、…, 第 九 十 矿 个 百 分 位 数 ,也 常 以 已 表 示 , 实 际 应 用 
时 ,为 表示 是 第 几 个 分 位 数 , 常 给 Q@ 以 有 下 标 , 加 昌 ) 表示 第 一 个 分 
位 数 , 符 号 检验 的 方法 可 以 用 填 各 种 分 位 数 的 检验 及 置信 区 间 估 
计 。 - 

BE 机 抽取 的 样本 ,其 = 个 样本 数据 ,或 ”对 数据 的 差 值 , 按 从 
小 到 大 的 顺序 排列 ;得 到 一 个 顺序 统计 量 。 其 某 一 分 位 数 记 作 Q, 
Q 是 与 之 相应 的 一 个 特定 的 值 ,那么 日 是 否 等 于 Q@,? 二 者 关系 如 
何 ?为 此 ,可 到 进行 双 侧 检验 或 单 侧 检验 ,所 建立 的 盆 设 组 为 

H: Q=Q, 
AL; QA, 

Ho: Q = Q, Ho: (= Wo 

Hr: Q>a, Ho; Q«Q, 
要 对 假设 作出 判定 ,采用 的 检验 统计 量 仍 旧 是 S$; SS, RUBUS 
统计 量 中 数值 大 于 Qo 的 个 数 ,5_ 是 小 于 Q 的 数目 (等 于 OQ, HZ 
RE AS TAE BEBA REP AA O FEO > FRE 
P- EH., NAHT, S- ROUGE EP 的 二 项 分 布 ,8; ME 
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MEES P. —1-— P...) XR P. P. A 
是 1 一 和 .与 二 项 式 检验 类 似 ,S，, MMS OK ATS 
遵从 带 有 参数 1 一 名 的 二 项 分 布 . 国 而 , 当 = 委 20 时 ,查找 附 表 IT, 
可 以 得 到 相应 的 王 值 ,从 而 作出 判定 . 表 2--13 是 判定 指 异 表 . 洒 = 
> 20 时 ,可 以 采用 正 态 近似 , 按 (2. 10) 式 计 算 Zior Za 查 附 表 
N ,得 到 P 值 作出 判定 . 表 2 一 20 是 它 的 判定 指导 表 。 


He 2 一 19 分 位 数 检 验 判 定 指导 表 
ERE Pm (i 10 
Hy; Q>Q% 带 有 1 一 名前 5_ ERRE 
Hoa Q<Q WA 0. £9 S. HAR 
Hy: QA WA OV SL ARAL — 8 f 


S_ HRA RRR 2 fi 


5,-0.5 — n8, $.— 0.5 — ntl — 8) 


beg = — Zo = (2.10 
28,01 — 6) A nO,C] — Oo) 


表 2 一 20 f rS i Or > 20) MEAR 


PERR P (HEN) 
Ho Q-Q PTT 
Ho Q«Q Z.4 HE 
Hy, QxQ, Zara fl Z-a BABA RR 2 48 


[ 52.15) 2.12 中 智商 差 值 的 第 一 个 四 分 位 数 小 于 
— 3, . 
分 析 : 为 判定 第 一 胎 出 生 和 以 后 出 生 的 成 年 人 智商 差 信 的 第 
一 个 四 分 位 数 是 否 小 于 一 3, 实际 上 就 是 要 建立 关于 四 分 位 数 的 
单 侧 假 设 ,其 假设 组 为 
Ho Q=-—3 
H: Q > 3 
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这 是 一 个 配对 样本 差 值 的 分 位 数 检验 . 表 2 一 21 是 根据 表 2 一 15 
数据 计算 的 各 对 数据 的 差 值 , 以 及 差 值 与 入, = 一 3 2 MRE. 
由 表 2 一 21 WW, S, = 3,8. = 10 一 13, 第 一 个 四 分 位 数 息 表示 
比 其 小 的 数据 个 数 是 顺序 统计 量 中 样本 数据 总 数 的 25 锡 , 即 在 其 
2 PARR P =0. 25, AL. =P,¿=1—P_-=0. 75. EHR I 
An —13,06—0. 75,8, — HAERE P. — 0. 0001, XP P f 
Xj 5 XU EZKOÉ a = 0. 05 SEU Eteh, ,因此 ,调查 数据 不 支持 Ha, 
表明 第 一 胎 出 生 的 智商 与 以 后 出 生 的 智商 之 差 小 于 一 3 的 数目 ， 


超过 调查 对 数 的 25%, 
$ 2—2] 

z y Ty r—.—(— 32462 
86 82 4 + 
90 94 一 4 一 
31 96 一 5 — ' 
101 106 一 5 一 
93 92 1 + 
85 90 一 5 一 
92 98 —6 一 
115 122 —5 一 
72 74 — 2 + 
75 80 一 5 一 
120 130 — 10 一 
106 110 —4 一 
104 109 一 5 一 


L 例 216 今天 成 年 人 的 睡眠 量 是 否 少 于 5 年 前 

5 年 前 某 地 区 的 调查 表明 ,成 年 人 在 每 日 24 小 时 中 的 睡眠 量 
中 位 数 是 7.5 小 时 ,每 日 睡眠 量 为 6 小 时 或 少 于 6 小 时 的 占 调 查 总 
数 的 5 多 ,9 小 时 和 9 小 时 以 上 的 也 占 5 多 。 现 对 8 个 普通 成 年 人 的 
抽样 调查 结果 为 ,每 日 24 小 时 中 睡眠 量 分 为 7. 2,8. 3,5. 6,7.4， 
7.8,5. 2,9. 1 $1 5. 8, ` 

分 析 ; 为 利用 这 批 调查 数据 考察 如 今 成 年 人 睡眠 量 是 否 比 5 
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EDO EUR AD op i a ee. ARES 年 前 调查 的 数据 ,对 于 
0. 05, 0. 50,0. 95 的 分 位 数 , 应 该 至 少 检验 一 个 假定 ; 即 进行 白 分 
位 数 的 被 验 . 对 中 位 数 是 和 否 减 少 的 裕 验 即 是 对 第 0. 50 个 分 位 数 的 


恰 验 .建立 假设 组 
FF + Qh. 50 = 7.5 
Ti_ Qas 7.5 


根据 调查 数据 可 知 ,S$_== 3.8. = 5,1 = 8, ATF 8, [= 0. 50, A mi ar 
ARR VCP = 0.50), 也 可 查 附 表 I (在 不 同 的 8 值 中 .找到 8 二 
0. 50 欧 那 一 询 ), 附 表 8 中 ,nx = 8,9,— 0.50,S, 二 3 HA BR 
P = 0.3633。 对 于 显著 性 水 平 a = 0. 05, P 值 已 足够 大 ,调查 数据 
支持 五。, 表 明 如 今 成 年 人 酝 眠 量 中 位 数 与 5 年 前 无 显著 差异 。 
对 第 0. 05 个 分 位 数 即 第 5 个 百 分 位 数 进行 检验 ,考察 如 今 了 区 

眠 量 是 6 小 时 和 少 于 6 小 时 的 天 数 是 否 超 过 5 吕 ,有 即 第 0.05 个 分 位 
SEB LT 6, 建立 假设 组 

Hi Qux = 6 

Ho. Qu <6 - 
TR TE AR eS, = 5.0. = 3,n — B,XEUR 1 中 ,依据 机 = 
i — P-—]1— 0.08 = 0.95,n = 8,8, = 5,448 P = 0.0058, 4 
于 显著 性 水 平 <= 一 0.01,P BERD RB A, A EE 
眠 量 梅 成 的 顺序 统计 量 中 ,第 5 个 百 分 位 数 已 小 于 6 小 时 ,也 就 是 
说 , 如 今 成 年 人 睡眠 量 是 6 小 时 和 少 于 6 小 时 的 人 数 已 超过 总 人 
F 5%. 

对 第 95 个 百 分 位 数 进行 检验 ,建立 假设 组 

Ho: Qu. — 9 

Hoi Qui <9 
根据 调查 数据 可 知 ,S. 1,8 一 = 7,n = 8。 按 表 2 一 19 BHR 
定 指 导 准 则 ,在 附 表 工 中 ,以 页 = 1— P.—1— 0.985 — 6.05, 


(280 o; RAE 5 PASH. 
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单 侧 备 择 假 设 
H, M=Mo Hy: M= Mo 
H; MM, H., MZM, 
泡 了 对 假设 作 雪 判定 ,需要 从 总 体 中 随机 抽取 -一 个 样本 得 到 
n 个 观察 值 .这 个 数据 至 少 是 定 距 尺度 测量 ,若是 定 序 尺 度 测 量 ， 
则 检验 所 需 的 等 级 ,符号 都 应 能 被 得 到 。n 个 观察 值 记 作 mns 
"ns 5M, mx D.D = x, — Mili = 1,21, 
OH OAS SAS ARAS Mo AR D, 关于 0 对 称 分 布 . 这 
时 ,对 于 D; 来 说 , 正 的 差 值 和 负 的 状 值 应 近似 地 相等 ,为 了 漠 盐 等 
级 大 小 作 判 定 , 先 忽略 D. 的 符号 ,而 取 绝 对 入 DiX D] d 
小 顺序 分 等 级 ,等 级 1 是 最 小 的 | 万] ,等 级 2 是 第 二 小 的 |D|, 以 
此 类 推 ,等 级 4 是 最 大 的 1D,| ED. KA ASAE ARE 
们 的 等 级 即 秩 次 ,得 到 正 等 级 的 总 和 与 负 等 级 的 总 和 ,虽然 等 级 本 
身 都 是 正 的 ,但 这 里 是 按 D, 符 号 计算 的 等 级 和 ,为 了 区 时 ,将 DD, 符 
SAEK. D| 的 等 级 和 称 作 正 等 级 的 总 和 ;反之 为 负 等 级 的 总 
和 。 开 ,为 真 时 , 正 等 级 的 总 和 与 负 等 级 的 总 和 应 该 近似 相等 ,如 果 
XE 等 级 的 总 和 远 远大 于 负 等 级 的 总 和 ,表明 大 部 分 大 的 等 级 是 正 
的 差 值 , 即 D, 为 正 的 等 级 大 .这 时 ,数据 支持 备 择 假设 HIM > 
M, .类似 的 ,如 果 负 等 级 的 总 和 远 远 大 于 正 等 级 的 总 和 ,天 明天 部 
分 天 的 等 级 是 负 的 差 值 , 即 D; 为 负 的 等 级 天 .这 时 ,数据 支持 备 择 
假设 A- MS Mo 因为 正 等 级 和 人 负 等 级 的 总 和 是 个 恒定 的 值 , 即 
1 十 2 十 中 十 n= 二 nin 二 1)/3 
E 此 对 于 双 剑 备 择 A, 来 说 ,两 个 总 和 中 无 论 哪 一 个 太 天 ,都 可 以 
被 支持 。 
检验 统计 量 。Wilcoxon 符号 秩 检验 所 定义 的 检验 统计 量 为 
T. AIT... 
T, 正 等 级 的 总 和 即 正 秩 次 总 和 
T . 负 等 级 的 总 和 即 负 秩 次 总 和 
这 里 ,7 了- 和 工 . 都 是 非 负 的 整数 ,并 且 
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Pet To= aln + 19/2 
它 从 的 到 值 范围 是 从 0 到 n(n + 1/2, 

已 值 的 确定 .由 于 了 _ 利 了 7'_ 的 对 称 性 ,加 上 了 ,十 人 -二 nln 十 
1)/2, 因 而 ,7', 和 了 - 能 抽样 分 布 完全 一 样 ,上 且 关于 n(n 十 1)/4 对 
HWE VE 给 出 了 -- 个 累积 的 概率 ,根据 2 AT. 的 右 尾 概率 或 
T. 的 扣 尾 概率 ,得 到 三 值 .依据 已 与 显著 性 水 平 & 比 较 , 可 以 对 数 

“EEG ES 瓦 。 作 出 判定 . 表 2 一 22 是 2 所 15 时 判定 指导 表 。 
3E 222 Wilcoxon 符号 挫 检 验 判 定 指导 事 


SEIS EE PRE CHE 
He. M> M T+ HORRE 
Ho. MM, T- ARRE 
Ho; MM, Ti AT. RAG BRR A 2 


Sa BABES) TIT AEF EAS TT 的 
标准 化 可 以 借助 于 减 去 均值 nO + 1)/4, 除 以 标准 差 
v/n(n + 1) (2n + 19/24 WE . FE (2. 14) 式 计 算 Zim 2 EE 
表 N ,可 以 得 到 相 诬 的 己 信 。 表 2 一 23 是 m > 15 HERE 

Ziq T,—0.5 — nint 13/4 

) Zn + DGn + 1)/24 
Z= T_— 0.5 — nat 1/4 

' ¿nta + 1) {2n — 1)/24 
E 2-23 Wilcoxon 符号 秩 检 验 判 定 指导 表 


(2. 11) 


EPA PE (MAN) 
Hat M Ma ZAR HAREE 
Ho. M<M, Za HG 


A: MÆ My £48 和 了 -na 太 者 右 席 概率 能 2 倍 
en a Iaras 


Wilcoxon 符号 秩 检 验 也 可 以 用 来 检验 关于 总 体 平 均 数 的 候 
AZ ` 


E Moo 
(62.18) 新 配方 是 否 有 助 于 防晒 黑 
某 防 晒 美 容 霜 制造 者 ,和 谷 了 解 一 种 新 配方 是 否 有 助 于 防晒 黑 ， 
对 ?个 志愿 者 进行 了 试验 .在 每 人 稍 椎 一 侧 涂 原配 方 的 美容 町 , 另 
一 侧 座 新 配方 的 美容 箱 , 背 部 福 太 阳 下 暴晒 后 , 按 预 先 给 定 的 标准 
测定 晒 黑 程度 如 表 2—25, 
x 2 一 25 两 种 配方 晒 明 程度 测量 结果 


TETO 新 配方 tx} | 85 ERFO 新 配方 (7》 


分 析 ; 这 一 何 题 是 配对 样本 ,同一 个 人 使 用 两 种 不 同 配方 的 
美容 钉 , 以 检验 两 种 配方 对 防晒 黑 的 作用 是 否 有 显著 不 同 , 可 以 应 
用 Wilcoxon 符号 秩 检验 。 新 配方 的 酉 黑 程 度 记 作 xz, 原配 方 的 为 
y, WAÉ d, = x; — Yi ELIE d, 关于 中 位 煞 对 称 , 那 么 两 种 配方 的 
作用 无 显著 差异 时 ,d 的 总 体 中 亿 数 应 是 0, 邯 M, = 0. 为 检验 新 配 
方 是 否 优 于 原配 方 , 则 应 建立 的 假设 组 为 

Hr: Mpa=0 
H.: MO : 
为 对 假设 作出 判定 ,要 计算 汪 | TO ,计算 过 程 如 表 2—26. 
HH Xt 
-二 1 十 3 二 4 
T_= nna + D/2-T,¿=77 + 10/2—4 = 24 
EEN = 7.7 = 24 ER VBR T_ ARE P = 0.055 3K 
个 概率 对 于 显 营 性 水 平 = 0. 05 RHE A. CHEE ARE ht, 
宜 取 稍 大 些 的 显著 性 水 平 ,以 避免 犯 第 二 类 的 错误 , 即 “ 以 假 为 真 ” 
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RSR HK OR a = 0.05, 则 该 调查 数据 支持 Ho BS PRAE 
方 对 防晒 黔 的 作用 没有 什么 显著 差异 . 若 对 于 显著 性 水 平 e= 
0. 10 ,该 次 调查 结果 则 不 支持 AY, , 即 调查 足以 说 明 新 配方 对 伪 是 
雄 的 效果 优 于 原配 方 . 若 希 望 同 时 减 小 犯 两 类 错误 的 可 能 性 ,应 增 
加 样本 数目 。 
表 2— 26 EE que E. qu 
A 8 -.  , Day ID IDINEDENS 
/01  — 38 — 42  -—aà4 4 1g  -— 
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一 ,符号 检验 和 Wilcoxon 符号 秩 检 验 比 较 

1. 共同 点 

符号 检验 和 符号 秩 检 验 都 是 非 参 数 检验 ,都 能 运用 于 单一 观 
察 的 数据 或 配对 观察 数据 的 差 , 都 能 用 于 总 体 中 位 数 或 差 值 总 体 
中 位 数 的 推断 .它们 对 总 体 所 要 求 的 假定 都 是 极 小 的 ;对 符号 检验 
来 说“ 旺 总 体 连 续 ; 对 符号 我 栓 验 来 说 ,再 增加 一 个 关于 中 位 数 对 
称 .这 两 种 检验 数据 测量 层次 的 要 求 都 不 高 .普通 的 符号 检验 被 合 
用 于 两 分 类 总 体 ,类 似 于 回答 “是 ”或 “不 是 ”的 问题 ,可 用 于 定 类 、 
尺度 测量 ,但 亡 求 差异 的 方向 能 够 被 表示 出 ;符号 秩 检 验 至 少 要 求 
定 序 尺度 测量 , 仅 当 等 级 和 符号 能 够 被 表示 出 时 。 由 于 两 个 检验 都 


与 符号 有 关 , 因 而 处 理 0 差 值 的 方法 是 共同 的 , 均 被 忽略 不 计 。 
2, 区 别 ' 


(D die D = xy ARA M — 0, 
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FES Re E ER EA EE ZI 2E HE 
PARA A Ee RAS IR ABEL A aS RR 
SREB T8] E B5 fei b RAAT SADE EE, É 
fA a AE A PRE SALT NEUES EIE BET 8S 
研究 和 报道 ,有 兴趣 的 读者 可 以 去 阅读 有 关 书 籍 . 在 大 多 数 情况 下 
Wilcoxon fT Ep gs RM HERR DC. 

3. 与 学 生 : 检 验 的 比较 

MEAS EME. ASEM MAGS ae Ae 
秩 检 验 , 学 生 t 检验 都 可 以 被 选择 使 用 ,因为 在 对 称 性 分 布 情况 
下 ,均值 与 中 位 数 相等 ,然而 ,学 生 上 检验 是 建立 在 正 态 分 布 假设 
、 基 础 上 ,这 是 一 个 比 对 称 性 假设 严格 得 多 的 假定 条 件 。 当 样本 数据 
的 正 态 假 定 可 靠 , 且 数 据 是 在 定 距 尺 度 测量 时 ,学 生 : 检验 作为 一 
入 最 强 有 力 的 方法 应 该 被 优先 选择 ,但 当下 列 情况 之 一 TAER, 非 
参数 检验 的 方法 要 优 于 参数 检验 方法 。 

OD 样本 数目 很 小 ; 

(2) 瞧 一 可 以 得 到 的 数据 是 定 类 或 定 序 尺度 测量 的 ，; 

(3) 作为 一 组 数据 的 处 理 ,样本 的 中 位 数 似乎 比 均值 更 可 舍 ， 

(4) 对 于 所 研究 的 癌 题 来 说 ,中 位 数 是 比 均 值 更 有 代表 性 的 
(HAR ; 

(5) 总 体 很 少 或 者 几乎 没有 一 个 概率 分 布 (对 符 导 秩 检 验 仅 
需要 一 个 对 称 性 假定 ); 

(6) 总 体 分 布 未 知 ,但 几乎 很 少 关 仆 于 正 态 。 


$2.5 游程 检验 


游程 检验 亦 称 违 贯 检验 或 串 检 验 , 是 一 种 随机 性 检验 方法 ， 
必用 范围 很 广 。 例 如 生产 过 程 是 否 需要 调整 , 即 不 合格 产品 是 否 随 
机 产生 ;奖券 的 购买 是 否 随 机 ;期 货 价 格 的 变化 是 否 随机 等 等 , 若 
事物 的 发 生 并 非 随机 , 即 有 某 种 规律 , 则 往往 可 寻找 规律 ,建立 相 
应 模型 ,进行 分 析 , 作 出 适宜 的 决策 。 
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一 ,普通 的 游程 检验 Ordinary Runs Test) 


1.3: 4249 4 XL 
-- 个 可 以 两 分 的 总 体 , 如 按 性 别 区 分 的 人 群 . 按 产品 是 否 有 
毛病 区 分 的 总 体 等 等 ,随机 从 中 抽取 一 个 样本 ,样本 也 可 以 分 为 两 
类 ;类 型 1 和 类 型 工 , 若 几 属 类 型 1 的 给 以 符 导 4 ,类 型 D dt 
以 符号 互 , 则 当 样 本 按 某 种 顺序 排列 (如 按 拍 取 时 间 先 后 排列 ) 时 ， 
一 个 或 者 一 个 以 上 相同 符号 连续 出 现 的 段 ,就 被 称 作 游程 ,也 就 是 
说 ,游程 是 在 一 个 两 种 类 型 的 符号 的 有 序 排 列 中 ,相同 符号 连续 出 
现 的 号 ,例如 ,将 某 售票 处 排队 等 候 购 票 的 人 按 姓 别 区 分 , 男 以 A 
表示 , 女 以 8 表示。 按 到 来 的 时 间 先 后 观 宕 序列 为 ,44BABB, 在 
这 个 序列 中 ,44 为 一 个 游程 ,连续 出 现 两 个 4A;B 是 一 个 游程 , 领 
先 它 的 是 符号 4 :跟随 它 的 也 是 符号 4; 显然 ,4 也 是 一 个 游程 ， 
B58 也 是 一 个 游程 .于 是 ,在 这 个 序列 中 ,4 的 游程 有 2 个 ,B 的 游程 
也 有 2 个 ,序列 共有 4 个 游程 ,每 -- 个 游程 所 包含 的 符 身 的 个 数 ， 
ES 为 游程 的 长 度 。 如 上 面 的 序列 中 ,有 一 个 长 度 为 2 的 4 游程 .一 
个 长 度 为 2 的 8 游程, 长度 为 1 的 A 游程 .B 游程 也 各 有 1 个。 
2. 基本 方法 
随机 抽取 的 一 个 样本 ,其 观察 值 按 某 种 顺序 排列 ,如 果 研 究 
所 关心 的 问题 是 :被 有 序 排列 的 两 种 类 型 符 导 是 否 随机 排列 , 则 可 
以 建立 双 侧 备 择 , 假 设 组 为 
Hy: 序列 是 随机 的 
于 ;序列 不 是 随机 的 i 
如 果 关 心 的 是 序列 是 和 否 具有 某 种 倾向 , 则 应 建 立 单 侧 备 择 ,假设 级 
为 
Ho: 序列 是 随机 的 
, Hi 序列 具有 混合 的 倾向 
或 
H, 序列 是 随机 的 
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Hr: FARANXNB RAN 

AT SRA. BORRA HEE DC EA BM 
E EZRET AAA» RE EK RETI AE BOULE EAE 
BE AA AE SERE. A Br ER Ah f Bl] E BY Jes SF EBA IA 
mA. RESID SCPE A B PERIERIES TES T SAP IF 
FJ; AABABB, FARA HTS 3 Hi fe m, Bo PREIE n MIN 
= mtn, 

RSS ZEA, 为 真 的 情况 下 ,两 种 类 型 符 导 出 现 的 可 能 
性 相等 ,其 在 序 谭 中 是 交互 的 .相对 禧 一定 的 严 ., 序 列 游程 的 总 
数 应 在 一 个 范围 内 。 若 游程 的 总 数 过 少 , 表 明 某 一 游程 的 长 度 过 
长 ,意味 着 有 较 多 的 同一 符号 相连 ,序列 存在 成 群 的 倾向 ; 若 游程 
BROS ,表明 游程 长 度 很 得, 意味 着 两 个 符号 频 人 每 交替 ,序列 具 
有 混合 的 倾向 .因此 ,无 论 游 程 的 总 数 过 允 或 过 少 , 都 表明 序列 不 
是 随机 的 。 根 据 两 种 类 型 符号 的 变化 ,选择 的 检验 统计 量 为 U, 

U = 游程 的 总 数目 

确定 卫 值 .游程 总 数目 U 的 抽样 分 布 在 附 表 VIL 中 给 出 ,序列 
中 数目 比较 少 的 符号 记 作 类 型 | ,数目 多 的 符号 为 类 型 I 。 对 于 
man hm +1220, m1 < 12 5,0 ER Va 中 查找 
到 相应 的 已 值 . 若 已 相对 于 给 定 的 显著 性 水 平 A, MEA S 
持 Ho REBR RIA H R 2 一 27 是 判定 的 指导 表 。 


5 3 一 27 游程 检验 判定 指导 表 
备 择 假设 Pi OE 
Hi: ”序列 上 共有 温 合 的 倾向 U 的 右 是 概率 
H- FRA AE U 的 左 尾 概率 
Hy: EPEAREN EA EA 


Amta = N > 20K m > 12.n > 12 时, 恰 验 统计 量 U 近似 雹 
BA 1 + 2mn/ N PERH vmn Omn — NINN D,E% 
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AAA HZ RZ IE IN UE A e 
fi .Z,.Za 计算 如 (2. 12) 式 , 表 2- 一 28 EP eT SE. 
u U -- 0.5 — 1 — 2mn/N 
E Camila — NO/N*'(N — 1) 


T (2. 12) 
U + 0.5 — 1 — Zmn/N 


Za= 
表 2 一 28 BH eA Tes 
备 择 假 设 P HAN) 
Ho. PERLA Al rn Za 的 右 属 概率 
Ho. 序列 具有 成 群 的 倾向 Zi 的 左 尾 概率 
Hy: 序列 是 非 随 机 Z 的 右 届 概率 的 2 售 


表 2 一 28 中 ,2 的 取 值 如 下 ， 
一 ZL 若 UZI + 2mn/N 
Z= ‘ Za # U>1+ 2mn/N 
3. 应 用 
[52.19] 荣 旅 游 点 该 年 气温 偏差 是 否 随 机 
某 旅游 点 该 年 二 月 份 的 气温 ,连续 10 天 被 记录 ,每 天 的 最 高 
气温 与 历史 上 同期 最 高 气温 平均 值 比较 ,高 于 均值 记 作 A , 低 于 均 
值 记录 作 8, 结 果 10 天 的 气温 依次 记录 为 AABABBAAAB. {EH 
a = 0.05 的 水 平 ,检验 高 温 的 偏差 是 否 随 机 。-: 
分 析 ; 根 据 检 验 的 要 求 ,建立 的 假设 组 为 
Hy: 序列 是 随机 的 
| Hr: 序列 非 随机 
在 调查 结果 按时 间 排 序 的 两 符 导 序列 中 ,有 6 个 4,4 个 吾 ,因为 符 
导 吾 的 数目 少 ,因而 吾 为 类 型 I A m = 4 = 6。 序列 4 的 游 
程 个 数 为 3,B 游 程 个 数 也 是 3, 游 程 总 数 U = 6. EME Eum = 4, 
n —6,U = 5 Af, P = 0. 405;m = 4,n = 6,U =7H,P = 0, 310, 
MR at 4,2 = 6,U = 6 Ht, PAZ 0.310 5j 0. 405 Ze [8] OE 
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n= N = 3029 20. AREE WIE BIE PBR 2— 28 的 提示 ,合适 
ig P(g SARE Z SAC FU = 4 所 以 2 可 以 计算 得 
到 | 

1 

— — 217/57 =— 3.81 
FEW N 中 ,Zi 二 一 3,81 的 左 尾 概率 小 于 0.0002, 这 相对 于 显著 
性 水 平 e = 0.05 来 说 是 一 个 极 小 的 值 ,因而 数据 不 支持 政 ,。 根 据 
这 次 调查 的 结果 ,产品 芍 秽 陷 有 成 群 产生 的 倾向 ,因此 ,应 每 天 频 
繁 抽取 小 样本 检验 ,以 保证 估计 的 可 靠 。 


二 基于 上 .下 游程 的 检验 


上 、 下 游程 (Runs Up and Down) 亦 称 升 降 串 .这 个 检验 不 是 
单纯 地 用 两 个 符号 的 多 少 以 及 游程 的 数目 来 进行 ,而 是 利用 每 个 
观察 值 与 紧 按 其 前 面 的 一 个 数值 比较 大 小 ,决定 升 . 降 ,利用 形成 
的 升降 串 进行 检验 .因此 它 比 普 通 的 游程 检验 能 够 提供 更 多 的 信 
B. i 

1. 上、 下 游程 的 含义 

随机 抽样 得 到 的 观察 值 按 某 -顺序 排列 ,序列 中 每 个 观察 值 
与 其 前 面 的 一 个 数值 比较 ,如 果 前 面 的 数值 较 小 ,就 构成 一 个 上 升 
串 : 即 一 个 上 游程 ;如 果 前 面 的 数值 比较 大 ,就 构成 一 个 下 降 串 , 即 
一 个 下 游程 .一 个 上 游程 中 包含 的 观察 值 数 目 , 就 是 游程 的 长 度 。 
例如 , 某 一 序列 的 观察 值 为 7,15,1,2;5,8。 这 个 序列 有 一 个 长 度 
是 1 的 上 游程 ,因为 第 二 个 值 15 比 前 面 的 信 7 EX. THE 
1 也 要 大 , 紧 跟 着 是 一 个 长 度 为 1 的 下 游程 ,然后 是 一 个 长 度 为 3 
的 上 游程 .如果 用 十 、 一 表示 上 升 或 下 降 的 变化 方向 ,那么 上 面 序 
列 的 变动 结果 是 十 , 一 , 十 , 十 , 十 ,这 个 序列 观察 信 的 数目 , 即 样 
本 数据 的 个 数 入 = 6, 上 .下 游程 的 总 数 为 3。 

2. 基 本 方法 
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和 普通 游程 检验 类 似 , 如 果 研 究 的 问题 是 序列 是 否 随 机 ,可 
以 建立 双 侧 备 择 ,车 关心 的 是 序列 是 否 有 某 种 倾向 , 则 建立 单 侧 备 
择 . 基 于 工 、 下 游程 的 检验 所 建立 的 假设 组 为 
Ha ”序列 是 随 机 的 
Hy, 序列 是 非 随 机 的 
Ho: 序列 是 随机 的 Ho: 序列 是 戎 机 的 
Ha: ”序列 其 有 混合 倾向 H: 序列 具有 成 群 倾向 
为 对 假设 作出 知 定 ,所 需要 的 数据 至 少 是 定 序 只 度 测 量 的 。 在 Ho 
为 真 的 情况 下 .相继 的 观察 值 之 间 差 植 的 符 导 为 十 或 为 一 的 可 
能 性 相等 .因此 ,上 、 下 游程 的 总 数 可 以 反映 序列 的 变动 .如 果 相 同 
的 符号 成 群 ,游程 的 总 数 就 会 太 少 ,表明 序列 是 有 一 个 恒定 方向 的 
AER TERT ,或 顺序 增加 ,或 顺序 减少 ;如 果 符 号 不 断 地 变化 ,游程 的 总 数 
就 会 很 多 ,表明 序列 有 经 常 的 波动 或 循环 移动 或 漂 衣 下 定 的 变动 。 
检验 统计 量 ,NN 个 不 同 观察 值 技 某 一 顺序 排列 后 ,可 以 得 到 
一 个 NN 一 1 个 正 号 或 负 号 组 成 的 相应 次 序 的 序列 ,这 个 序列 的 上 、 
下 游程 总 数 就 是 检验 统计 量 , 记 作 耻 , 即 有 
V= 上 ,下 游程 的 总 数 | 
MWe PH. MRA RV SU A AAR. 的 抽样 分 布 在 附 
ge X 中 给 出 ,V 的 取 值 范围 从 1 到 NN — 1. SE (EBD aE 
的 数目 , 当 N <= 25 时 ,根据 和 NV 可 以 在 附 表 区 PERMAN P 
值 . 表 2 一 29 是 检验 判定 的 指导 表 。 


表 2- -29 上 .下 游程 检验 判定 指导 下 
— -PE HED 
HA PARRER 。 ”VV 的 省 必 概率 
H.. PIERREA V ZEER 


Hi 序列 是 非 随机 的 VAD RE MERE 2 iF 


ANS 25 Wt RATE Y UE 08 BB (OON — 1973.58. 
HER YEN — 29)790。 通 过 连续 性 修正 ,计算 得 到 Zr Za Æ 
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排列 .中 位 数 是 25; 刘 高 于 中 位 数 的 编号 为 1; 低 于 中 位 数 的 编号 
Ay ORF Ae 2 一 3] 中 的 按 观 察 顺 序 记录 的 分 数 换 成 相应 的 符号 0、 
1, BA] m — 12.5 =12,N =m + n= 24,U = 10, EWE MI, 
EP —0.150. RFE ROS. Em PEZ 200. 0150) = 0. 30, 
对 于 显著 性 水 平 a 一 0.05,P 已 足够 大 ,表明 数据 支持 五 ,, 即 调查 
结果 没有 受 儿 童 之 间 相 互通 气 的 影响 ,是 随机 的 ， 

45231 按 现 察 上 顺序 记录 的 儿童 好 斗 程度 评分 


上 .下 游程 检验 ,将 表 2 一 31 的 调查 评分 , 按 升 , 降 给 以 符号 

+, 一 ,得 到 下 面 23 个 符号 
一 + 二 ;十 :一 ;十 :一 ;十 ;十 ;十 ,一 ,十 ;十 ， 
一 十， 一 ， 一 ， 二 ， 一， 一 ， 一 ， 一 ， 一 ， 十 

这 一 序列 ,包含 上 .下 游程 数目 总 共 14 个 , 即 了 一 14。 查 附 表 K LN 
= 24,V = 14, P = 0. 2768, H TEM RO Ue PO 2.00. 2768) 一 
0. 5536。 显 然 , 对 于 显著 性 水 平 = 0.05,P 已 足够 大 ,因此 ,调查 
数据 在 5% 的 显著 水 平 上 不 能 拒绝 H ,表明 调查 结果 没有 受 儿 童 
相互 间 通 气 的 影响 ,与 普通 游程 检验 的 结论 一 致 。 


第 三 章 ”两 个 相关 样本 的 非 参 数 检验 


某 种 统计 检验 方法 应 用 时 ,不 仪 与 数据 的 测量 层次 有 关 , 还 
与 抽样 的 特点 有 关 。 在 抽取 样本 时 有 丙种 形式 :相关 的 和 独立 的 。 
营 第 一 次 抽样 的 所 有 详 本 其 一 属性 的 测量 结果 ,不 影响 第 二 次 抽 
祥 的 所 有 样本 同一 属性 的 测量 结果 , 则 这 种 抽样 是 独立 的 ;车 一 次 
抽样 的 测量 结果 影响 另 一 次 抽样 测量 结果 , 则 这 种 抽样 是 相关 的 。 
本 章 介绍 两 个 相关 样本 的 非 参 数 检验 方法 。 

实际 问题 中 ,常会 有 这 样 的 情况 , 某 种 药物 对 治疗 某 种 疾病 
是 否 有 效 , 某 种 训练 方法 是 否 能 提高 人 的 能 力 , 某 次 宣传 是 否 能 提 
高 人 们 的 认识 ,价格 上 涨 是 否 会 产生 不 良 影响 等 等 . 当 研 究 者 希望 
知道 沿 种 处 理 结果 是 否 相同 ,或 哪 种 更 好 时, 往往 需要 采用 两 个 样 
本 的 统计 检验 .这 时 ,常用 经 过 处 理 的 -- 组 和 未 经 处 理 的 一 组 比 
较 ,或 者 一 种 处 理 组 与 另 一 种 处 理 组 相 比较 ;为 了 各 免 或 尽量 减少 
由 于 其 它 因素 影 引起 的 两 组 之 间 的 附加 差异 ,研究 中 通常 采用 两 
个 相关 样本 。 例 如 ,在 接受 两 种 不 同 训练 方法 的 人 员 中 ,由 于 智力 、 
接受 能 力 ,耐力 等 方面 的 不 同 ,会 导 玛 不 同 处 理 的 结果 产生 差异 ， 
这 不 是 所 要 研究 的 问题 ,而 是 其 它 因素 影响 产生 的 附加 差异 ,这些 
因素 在 实施 不 同 处 理 前 必须 排除 ,为 获取 相关 样本 , 常 应 用 两 种 广 
式 。 一 是 让 每 一 研究 对 象 作为 自身 的 对 照 者 ,一 是 将 研究 对 象 两 两 
配对 ,分 别 给 每 一 对 两 个 成 员 以 不 同 处 理 .在 进行 配对 时 ,应 让 每 
一 对 在 可 能 影响 处 理 结果 的 其 它 因素 方面 尽量 相似, 以 尽量 避免 
和 减 小 附加 差异 。 一 般 来 说 ,用 研究 对 象 自 身 作为 对 照 者 要 优 于 配 
对 方法 ,因为 很 难 在 配对 过 程 中 ,完全 控制 作 其 它 的 影响 因素 。 
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$3.1 符号 检验 


一 ,基本 方法 


设 有 两 个 连续 总 体 XY, 累积 的 分 布 应 数 分 别 为 F(z)， 
(3)。 随 机 地 分 别 从 两 个 总 体 中 抽取 数目 为 4 的 样本 数据 Cz os 
50,7 MO Yes ttt yas WE {1ER 4444 I) EERDER Cr PEILI 
Gr. 42 ARA EI ERR AAA A a, BP FG = 
FO) J& SE BUT. XY 的 总 体 分 布 未 知 ,而 研究 也 并 不 关心 它 
们 的 具体 分 布 形式 ,只 是 关心 分 布 是 否 相 同 ,因而 ,可 以 采用 位 四 
参数 进行 判断 。 若 两 个 样本 的 总 体 具 有 相同 分 布 , 则 中 位 数 应 由 
IE] , 印 在 = 个 数 对 中 ,= 太 于 AAN a NF y. 门 个 数 应 相差 不 
EE serai gy 

Ha Pla, > y) = PG < y) 对 所 有 

Ai; Pla > y) zx PG, < y) rop 
mM 果 关 心 的 是 某 一 总 体 中 位 数 是 否 大 于 另 一 总 体 中 位 数 ， 则 可 建 
TRMA FE ,假设 组 为 
Ho: PO > yp = Pla, Ly) fy; PO; ¥) = Plz, < y) 
Ay; Pla > yd) > PG y) H: Pla > yp < Pla, < y) 
EH, 下 ,x; BAKE Y: 的 趋向 ,在 H. 下 ,y; 有 大 于 E, 的 趋向 。 

为 对 假设 作出 判定 ,所 需 的 数据 至 少 是 定 序 尺度 测量 .与 单 
样本 的 符号 检验 相同 ,两 个 相关 样本 的 符号 检验 也 定义 5S, .S_ 为 
-检验 统计 量 ,5 , ao 差 值 符号 是 正 的 数目 ,S_ 为 差 值 符号 是 
REE E yt 5 = n A, AKL +2, > yi 的 配对 数目 与 > SLM 
的 配对 数目 相等 ,也 就 是 $5, 与 $5_ 的 数值 相等 .由 于 SIL. 的 抽 


样 分 布 是 二 项 分 布 Bon, Ss n 是 配对 数目 ,过 7 Eft B HE ELS E 


率 ,因而 合适 的 "e W 中 查找 到 ， " P 值 相对 于 显著 
性 水 平 “ 很 小 , 则 数据 不 支持 五 .判定 指导 表 可 参见 表 2- 12 4 0 
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20H ERE UM Ma > 20 时 ,应 采用 (2.7) 式 的 计算 公 
AA EME PAE RA GJER PE. 


二 .应 用 


[55.1] 教学 参考 资料 对 于 指导 学 生 自学 是 否 有 效 

为 帮助 学 生 通 过 目 学 提高 对 知识 的 掌握 ,编辑 了 符合 教学 大 
网 的 教学 参考 资料 .针对 某 一 概念 的 掌握 进行 实验 ,随机 选取 了 
15 名 学 生 , 他 们 在 使 用 参考 资料 之 前 的 得 分 如 表 3 1。 学 习 参 考 
资料 后 ,重新 对 这 一 概念 进行 测试 ,得 分 也 列 在 表 3 一 1 中 .检验 这 


部 参考 资料 是 否 促 进 学 生 掌 握 知 识 。 
E 3 一 1 学 生 琴 次 测试 成 缚 
SERO 112 3 4 5 6 7 8 9 1011 12 13 14 15 


$8 —1X In, Sit 2 2 2 2 3533838833 32332 3 
Sp — wk nu at 3.4 8 3 2.8 4 4 2 4 4 3 4 4 4 


分 析 : 由 于 关心 的 是 学 生 使 用 参考 资料 后 是 否 对 概念 的 掌握 
GT AWW eM ee ,假设 组 为 
Ay; Pla, > y) = PO, < y) 
Ho. Pla, y) «PG; « y) 
zt 为 第 一 次 检查 的 成 绩 ,y, 为 第 一 次 测试 的 成 绩 ; 由 表 3 一 1 的 分 
ATH S. = 2,5.— 10; 有 3 对 差 值 为 0, 无 法 记 十 或 一 BIEN 
此 ,符号 总 数目 * = S,+S8_=—12, KEL ERS W 中 查找, 
= 12,5-= 10 的 右 尾 概率 P = 0.0193, 对 于 显著 性 水 平 < 一 
0. 05, 显然 王 利 够 小 ,因而 数据 不 支持 瑟 ,, 即 学 生 通 过 自学 参考 资 
料 对 提高 知识 有 益 ,表明 教学 参考 资料 对 促进 学 生 掌握 知识 是 有 
效 的 。 
【 例 3.2] 母亲 是 否 比 父亲 更 强烈 地 认识 到 父亲 教育 孩子 
的 重要 l 
在 研究 父亲 对 儿童 发 展 的 影响 作用 时 ,进行 了 一 项 调查 . 随 
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机 抽送 17 对 夫妇 ,其 家 庭 均 因 两 地 分 居 eR EY. oy OER 
AE ,一 年 后 团聚 .针对 父亲 的 教育 对 孩子 影响 较 大 这 一 问题 询 
问 ,结果 如 表 3 一 ?。 表 中 是 对 父 . 邢 态度 的 评分 ,5 分 代表 最 强烈 的 
认识 ,1 分 相对 最 弱 ,z 是 父亲 的 态度 ,x 是 母亲 的 态度 。 

表 3 一 2 ”父母 对 父亲 教育 孩子 重要 的 认识 


分 析 : 这 是 一 个 配对 样本 的 例子 , 例 3.1 是 将 研究 对 象 自身 作 
为 对 照 首 ,形成 两 个 相关 样本 ,此 例 中 是 采用 夫妇 配对 ,讨论 同一 
È TRIS) - -家 庭 的 情况 ,因而 配对 有 意义 ,符合 符号 检验 的 条 件 。 
由 于 关心 的 是 母亲 比 父 亲 更 强烈 地 认识 到 父亲 教育 孩子 重要 , 因 
比 是 单 侧 检验 ,建立 的 假设 组 为 
Ha Pla, > y) = Pilz, < y) 
Ho. Pla, > y) < Pla; < y) | 
因 为 预言 母亲 比 父 亲 的 感受 更 强烈 ,因而 评分 应 是 母亲 比 父亲 更 
B.E x, 一 久之 0 的 数目 应 较 多 , 备 择 假设 选择 了 五- .由 表 3 一 2 
可 知 , 其 中 3 对 去 妇 的 态度 一 样 , 分 数 相 等 , 差 值 为 0, 不 记 符号 , 因 
sn = 14,8,=3,8..=1. AW Mn = 14,5. — 11 AE HR 
P = 0. 028734 FT ERTEKE a = 0. 05, PEA EA 
支 持 五 ,调查 结果 表明 ,母亲 确实 比 父亲 更 强烈 地 感到 父亲 教育 
BETREF, | 
配对 样本 位 置 的 符号 检验 ,在 第 二 章 中 已 介绍 ,实际 上 那 也 
是 两 个 相关 样本 的 情况 。 
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$3.2 Wilcoxon 符号 秩 检 验 


一 .基本 方法 


两 个 相关 样本 的 Wilcoxon 符号 秩 检 验 也 是 用 来 检验 配对 样 
本 是 否 有 差异 的 方法 . 它 不 仅 异 助 于 两 个 样本 差 值 的 符号 ,而 且 利 
用 了 差 什 的 大 小 ,因此 , 它 比 符号 检验 有 更 精确 的 判断 。 
it X.Y BPE AA, BRAM PRAISE REL Bl 

NPAT A GP BR 8 个 观察 值 ， 组 成 n 个 数 对 (! 34) (9 yo 
ed od D, = 2; y HX Y RAMA, A 

POD, > 0) = PD, <0) | 
成 立 , 即 AE y, 的 概率 与 zx, 小 于 y, 的 概率 相等 .这 也 意味 者 全 
部 差 值 D, 的 中 位 数 等 于 零 . 因 此 , 零 假 设 也 可 以 是 

Ho D, 的 中 位 数 = 6 
这 与 $2.4 中 配对 样本 的 符号 秩 检验 是 一 致 的 , 当 研 究 的 问题 仅 
关心 两 个 总 体 的 分 布 是 否 相同 ,或 说 两 个 总 体 中 位 数 是 否 相 同时 ， 
AMUSE XY 之 间 的 相互 关系 中 ,存在 某 种 趋势 , 则 应 建 
立 单 侧 备 择 . 如 果 认 为 的 大 多 数值 大 于 相应 的 值 % ,那么 单 便 备 
择 为 | 

: AL, PCD, > 0) > PD «0 

或 

H.. D,üirbfitili > 0 
如 果 认为 y. 的 值 大 多 数 大 于 相应 的 zx; 的 值 , 则 单 倒 备 择 为 

Ho. PD, > 0 < PD, <0) 
» ] 

Ho. Dp; 的 中 位 数 < 之 0 
车 将 差 值 D 的 总 体 中 位 数 记 作 Mn, 那么 , 两 个 相关 样本 的 
Wilecoxon 符 号 秩 检验 与 8 2.4 中 配对 样本 位 置 的 符 导 秩 检 验 基本 
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Di 


方法 相同 E OLA — E REP ERR 
2 一 22, 表 2-23 HEHE, 


二 .应 用 


[ 513.339 幼儿 园 的 生活 对 核子 的 社会 知识 是 否 有 影响 
有 人 斌 为 儿 登 上 绩 儿 园 有 助 于 其 认识 社会 ,有 人 则 认为 儿童 
在 察 一样 可 以 获得 社会 知识 .为 了 解 它们 是 否 存 在 差异 ,对 8 个 同 
伺 变 生 几 童 进行 实验 ,随机 指定 8 对 中 一 个 上 幼儿 园 , 另 一 个 则 在 
家 ,经 过 一 个 时 期 后 ,通过 对 他 们 淘 间 ,给 他 们 分 别 作出 评价 .评分 
ARMA 3 一 3。 
表 3 一 3 3 对 儿童 的 社会 知识 成 绩 


:幼儿 国 儿 童 ERLE ¿LIL ae 


分 析 : 虽 然 可 以 相信 得 分 多 的 孩子 比 得 分 少 的 孩子 社会 知识 

要 多 ,但 由 于 是 定 由 尺度 测 其 ,无 弧 对 零 入 ,因此 不 能 认为 得 80 分 
的 纺 子 社会 知识 是 得 40 分 的 孩子 的 2 倍 ,也 不 能 认为 80 分 与 60 
”分 的 社会 知识 之 差 一 定 是 60 分 与 50 分 之 差 的 2 倍 , 但 是 ,可 以 表 
定 ,80 分 与 60 分 所 代表 的 社会 知识 之 差 一 定 大 于 60 分 和 50 分 之 
间 的 差 .所 以 将 分 数 差 值 的 绝对 值 排序 是 有 意义 的 ,这 样 就 有 能 够 
运用 Wilcoxon 符号 秩 检 验 判 定 在 家 和 上 幼儿 园 对 孩子 的 社会 利 
识 是 否 有 影响 ,由 于 只 关心 两 组 儿童 的 社会 知识 是 否 有 差异 ,因此 
应 建立 双 侧 备 择 。 假 设 组 为 

Ay, D, BPE = 0 

Bs: D, 的 中 位 数 关 0 
用 文字 表述 为 
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Hy: RALLIES MAAS 
H: 两 组 儿童 的 社会 知识 有 差异 
根据 表 3 一 3 的 数据 计算 IDIET..T- ,计算 过 程 如 表 3 一 4。 


表 3- 4 检验 统计 量 计算 表 

E: y D=zx=y ID| |pjm Dim 

78 62 4 4 5 + 

70 58 12 12 8 + 

67 63 44 5 5 + 

81 77 4 " 5 + 

75 78 —2 2 2 一 

72 73 —1 1 i — 

83 82 3 3 3 十 

83 78 5 5 ? + 
由 表 可 知 

T,=5+8+5+5+3+7= 33 

T_= 3 


WUE n = 8,7, t T PRAT. = 33 ,在 附 表 VI PERHE P 
(6. 452) T, = 33 FE ERE P. = 0.020, 这 一 概率 的 2 偿 为 0.04, 对 
于 显著 性 水 平 <= 0.05, 忆 值 显然 较 小 , 故 调查 结果 不 支持 IX 
表明 在 5 多 的 显著 性 水 平 土 ,拒绝 零 假设 ,在 家 和 上 幼儿 园 对 儿童 
， 的 社会 知识 有 影响 .从 计算 结果 看 出 , 十 号 大 大 多 于 一 号 ,表明 
上 幼儿 园 的 儿童 社会 知识 成 绩 普 遍 高 于 在 家 的 儿童 。 


62 


第 四 章 ”两 个 独立 样本 的 非 参数 检验 


利用 两 个 相关 样本 进行 研究 ,对 某 些 间 题 是 很 方便 的 。 但 现 
实 中 要 做 到 很 好 配对 并 不 容易 。 若 由 于 配对 不 当 或 无 法 配对 ,第 三 
BE 介绍 的 方法 不 能 使 用 ,这 时 可 以 运用 两 个 独立 样本 的 非 参数 检 
验方 法 。 两 个 独立 样本 可 以 各 自从 两 个 总 体 中 随 抽 抽 选 获得 ,也 可 
以 对 随机 抽样 的 一 个 样本 诸 元 素 ,随机 分 别 实施 两 种 处 理 而 形成 ，。 
两 个 样本 的 观察 信 数 日 不 一 定 雪 求 相 同 . 


分 析 两 个 独立 样本 常用 的 参数 方法 是 上 检验 , 即 对 两 样本 均 ， 


值 是 否 相 等 的 检验 .检验 要 求 分 析 的 数据 是 来 自 方差 相等 的 正 态 
分 布 总 体 的 独立 观察 结果 ,并 至 少 是 定 距 尺度 测量 .实际 研究 中 ， 
由 于 种 种 原因 ,往往 不 符合 上 检验 的 条 件 或 并 不 在 乎 是 否 符合 条 
件 ,t 检 验 无 法 使 用 。 当 研究 所 处 理 数据 的 测量 恢 于 定 路 尺度 ,或 不 
愿 做 严格 的 假设 而 司 结 论 更 具 普 遍 性 或 无 从 得 知 总 体 分 布 ,或 总 
体 分 布 非 正 态 等 等 ,选用 非 参 数 检验 方法 往往 更 为 有 效 。 


$4.1 Mann-Whitney-Wilcoxon 检验 


Mann-Whitney-Wilcoxon ti, HR E E -维尔 科 克 
森 检 验 ,简写 为 M-W-W 检验 , 亦 称 Mann-Whitney U 检验 


一 、 基 本 方法 


ATER X.Y HRA RRA PLP, BER 
APF SF, ERARAS I BWSR 
Ho: FD = F,G0 EUR BS e 
HRS E IS Ie Here ERE LR BARA ,也 可 以 采用 上 述 零 假设 .在 
实际 问题 中 ,应 用 检验 常 是 考察 两 个 总 体 的 中 心 是 否 相 同 ,车 
M: M, DAE X.Y 总 体 的 中 位 数 , 则 零 假设 可 为 
Ha M,=M, 
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n = 


#4 XY 都 存在 算术 平均 数 时 ,也 可 以 建立 两 个 均值 相等 的 零 候 
R. 当 研 究 只 美 心 两 个 总 体 中 位 数 是 否 有 差异 时 ,采用 双 侧 备 择 ; 
HAA X 的 值 可 能 大 于 了 的 值 这 种 趋势 或 倾向 存在 时 ,应 建立 单 
侧 备 择 

Hy: M.>M, 
车 相反 ,X 的 值 可 能 平均 地 小 于 工 的 值 , 则 单 侧 备 择 为 

Ho; MM, 


PP. 答 验 可 建立 的 假设 组 为 
Ho; M.=M, 
H: M._AM, 


Hy; M,=M, Ho. M, = M, 

Ay, M> M, Hi: M, > M, 
为 了 对 假设 作出 判定 ,分 析 的 数据 应 是 两 个 相互 独立 的 随机 样本 
A Em Al Yi ye Jno Eat a! AGERE BRE, ALF, 中 随机 
抽取 出 来 ,数据 的 测量 层次 至 少 是 定 距 尺度 ,若是 定 序 尺度 测量 ， 
则 每 个 观察 值 的 相对 大 小 应 能 被 确定 。 

MRA, AR RA m PX Y 的 数据 , 按 数 值 的 相对 大 
小 从 小 到 大 排序 ,又 .的 值 应 该 期 望 被 很 好 地 混合 ,这 六 十 一 和 
个 观察 和 值 能 够 被 看 作 来 自 于 共同 总 体 的 一 个 单一 的 随机 样本 ,车 
大 部 分 的 Y 大 于 六 ,或 大 部 分 的 有 大 于 了 ,将 不 能 证 实 这 个 有 序 的 
序列 是 一 个 随机 的 混合 ,将 拒绝 X. 了 来 自 一 个 相同 总 体 的 零 候 
设 。 在 了 混合 排列 的 序列 中 ,和 占有 的 位 置 是 相对 于 了 的 相对 
位 置 ,因此 等 级 或 称 苇 是 表示 位 置 的 一 个 极为 方便 的 方法 ,在 六、 
Y 的 混合 排列 中 ,等 级 1 是 最 小 的 观察 值 ,等 级 N 是 最 大 的 。 若 蕊 
的 等 级 大 部 分 大 于 Y 的 等 级 ,那么 数据 将 支持 互 ; ;而 了 的 等 级 大 
部 分 小 于 了 的 等 级 , 则 数据 将 支持 HL. .无 论 上 面 郧 一 种 情况 发 
生 , 双 侧 的 备 择 五 ,都 将 被 支持 。 

检验 统计 最 。 根 据 上 面 的 基本 原理 ,过 7 检验 定义 的 窒 验 统计 量 
Y . 
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is a I OT rp HE pp rrr 


En AR 


T, = X SAAB X 的 秩 和 
T, = Y SRA. a Y 的 秩 和 和 
HF XA Y 混合 序列 的 等 级 和 为 
1 二 2 十 十 NN 二 NN 十 15/2 
ELT, +T, = NON 十 1)/2。 从 而 可 得 
T, = NWN + 1)/2— T. 
M-W-W 检验 可 以 直接 用 7 了 ,作为 检验 统计 量 , 也 可 以 用 UU 被 定 
XS 
U — T, — m(m 4- 15/2 
例如 ,一 种 药物 有 效 性 的 实验 ,一 组 为 实验 组 ,一 组 为 对 照 组 ,实验 
结果 评分 为 
实验 组 (X) -= 12 18 
对 照 组 CY) 6 9 11 13 
将 这 些 评 分 按 增加 的 次 序 排列 ,并 注意 哪 一 个 评分 为 站 组 的 , 哪 
一 个 为 工 的 ,同时 给 出 秩 , 结 果 为 
6 8 9 11 12 13 18 
fk 1 2 3 4 5 6 7 
Aa Y X Y Y X Y X 
由 上 面 排序 可 知 
T,=2+5+7=14 
T,=1+3+4+58=14 
Hymn = 3, =4 MN =m++n=7, TT, = NON +19/2-T 
= 28 — 14 = 14.0 = Tx —món + 10/2214 —6— 8,U BY 
FPE ST XU uk AE ERA IF SOX MATES 80 Y 
的 评分 有 1 个 , 先 于 半 的 评分 12 的 了 的 评分 值 有 3 个 :6、9,11, 而 
先 于 最 后 一 个 亏 的 评分 值 的 了 值 有 4 个 :6.9.11 和 和 13。 在 互 了 混 
合 的 序列 中 ,7 的 评分 值 先 于 总 的 总 次 数 为 1 十 3 十 4 一 8, 这 就 是 
检 验 统 计量 上 ,一 般 情 况 下 ， 当 丙 组 样本 数据 数 昌 不 等 时 ， FUE 
旧 的 组 记 为 X Bm sn. 
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确定 己 值 .在 M-W- 家 检验 中 的 统计 量 了 ,当头 委 半 时 , 取 值 
为 整数 ,范围 为 六 (mr + 1)72 到 《2N 一 下 十 1)72。 这 时 , 工 . 的 抽样 
分 布 关于 其 均值 mCN + DARE 3E m aL LOR E, 
AAR GR mn UR CT. 的 值 查 附 表 X EY P (8.25 T. < 
m(N + 1)/2 IF BARRE, ET, m(N 十 1)/2 则 查 右 尾 概 
"Re 4 一 1 是 检验 的 判定 指导 表 .。 当 min WKF 10 时 ,了 近似 于 
均值 为 mn 十 D/2. FEE V mnON 十 D/12 Bg EA) ux 
时 ,通过 连续 性 校正 ,利用 (4. D 式 计 算得 到 o Zo EWEN, 
得 到 相应 的 己 值 .判定 指导 表 见 表 4 一 2。 


表 4- | U 检验 判定 指导 表 
备 择 假 设 PE x2 
H,, MoM, T.U RENI 
Ho: Ma € M, T: KARR 
H,, M, Æ M, T: 较 小 概率 的 2 fü 
Z., = To + 0.5 —m(N + 1/2 
V mnCN + 19/12 AD 
Z= T, — 0.5 — mCN + 13/2 
J/mn CN + 19/12 
表 4-2 U 检验 判定 指导 表 
ARR PH (HAHN) 
Hi; M, 2M, Za y 的 右 尾 概率 
H, M.«M, 2 的 左 尾 概率 
Hi. M. M, Z 的 右 尾 概率 的 2 fg 


表 4 一 2 rb Z BUS ORCI IE TL 有 所 不 同 ,定义 如 下 
-Zs T,« mN + 1) /2 
z -1 Zar T,>m(N+1)/2 
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二 ,应 用 


Laai 某 种 药物 对 治疗 肿瘤 是 和 否 有 效 
选择 9 只 白鼠 ,作为 抗 交 药 物 笠 选 的 对 象 .9 RA RAER 
件 相 同 ,同时 注射 致 冶 物 .然后 随机 选取 其 中 3 只 进行 抗 癌 药物 处 
理 . 种 瘤 的 重量 是 榨 验 药物 有 效 性 的 一 个 指标 .经 过 一 个 固定 的 时 
间 周 期 后 ,将 9 只 白 雇 的 肿瘤 割 除 称 重 ,结果 如 下 《重量 单位 是 克 ) 
处 理 组 (X) | 0.94,1.56,1. 15 
控制 组 CY 1.20,1.63,2. 26.1. 87,2. 20,1. 30 
分 析 : 若 该 种 抗 瘙 药 物 有 效 , 处 理 组 白鼠 肿瘤 的 重量 应 该 小 
子 榨 制 组 的 平均 重量 ,由 于 这 些 实验 采用 的 是 小 样本 , 且 为 两 个 独 
立 样 本 ,数据 测量 海 定 比 尺度 ,可 运用 Mann-Whitney-Wilcoxon 
检验 .建立 的 假设 组 为 
Ho: M,=M, 
H: M.<M, 
将 肿瘤 重量 从 小 到 大 排序 为 
0. 94, 1. 15, 1. 20, 1. 30, 1.56, 1. 63, 1. 87, 2.20, 2.26 
E 1 2 3 4 5 6 7 8 9 
组 X X Y Y X Y Y Y Y 


T.=1+ 2+5=8,T,=3+4+6+7+8+9=37.m 
= 3,7 = 6. AM X, = 3.7 = 67, = 8 AHAB RSP = 
0. 048,34 F E HEIKO a = 0.05, P 还 不 通 大 ,因此 ,实验 数据 不 
支持 五 ,, 即 9 HE BRTZUS cus A 的 显著 性 水 平 
上 ,该 抗 瘤 药物 对 控制 肿 瘦 有 效 。 


三 \ 同 分 的 处 理 


在 Ty yas X E Hr tte Ya 排序 时 , 若 其 均 能 精确 测量 
数据 完全 相同 的 可 能 性 极 小 ,但 有 时 测量 达 不 到 很 高 的 精度 ,因而 . 
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会 出 现 相 同 的 观察 值 .序列 中 观察 值 相 同 称 作 则 分 .观察 值 问 分 
Bt. 其 秩 为 所 占 位 置 顺 序号 的 算术 平均 数 。 若 阁 分 出 现在 一 个 样本 
之 站 ,检验 的 精确 性 将 不 会 党 到 影响 .但 知 同 分 出 现在 两 个 样本 之 
中 , 给 这 些 癌 分 值 以 相同 的 秩 , 将 会 降低 检验 的 精确 性 .由 于 小 样 
本 情况 下 ,这 种 降低 不 大 , 才 通 常 忽略 ,但 大 样本 时 ,应 采用 (4.2) 
HARE T. 抽样 分 布 的 标准 差 , 即 当 m、n 均 太 于 10 时 ,无 论 在 一 
个 样本 内 出 现 同 分 ,或 酚 个 样本 间 出 现 同 分 ,或 一 个 样本 内 与 两 个 
样本 间 均 存在 同 分 ,应 以 (4.2) 式 蔡 代 (4., 1D 式 中 的 分 母 ,(4.2) 式 
中 的 # 是 同 分 的 观察 值 数目 。 如 有 两 个 样本 的 观察 值 分 别 是 ,总 : 
1,2,5,55Y:1,3,6,8,8,8 观察 值 中 有 2 个 1,2 个 5,3 个 8 于 是 ,mm 
= 2,t; = 2,u, = 3, 


fmnCN + 1) ma(2w — Ey) 
N 


12 12N(N — 1) 
= ENANA — D— Gw — X0] 
[ 155 4.23 癌 题 按 难 易 次 序 提 问 是 否 影 响 学 生 正确 回答 的 
能 力 
从 心理 学 的 角度 看 , 按 问题 的 难 易 程度 顺序 提问 会 影响 学 生 
正确 回 管 的 能 力 , 从 而 影响 他 们 的 总 分 数 。 为 检验 这 种 观点 ,随机 
地 将 一 班 学 生 20 人 分 成 两 组 ,每 组 10 人 .设计 一 组 问题 ,分 成 4、 
BS A 卷 是 问题 按 从 易 到 难 的 次 序 安排 ,B 着 相反 ,从 最 难 到 最 
易 . 两 组 学 生 分 别 回答 ALB 卷 ,考试 被 控制 在 完全 相同 的 条 件 下 
进行 ,评分 结果 如 于， 
A, 83, 82, 84, 96, 90, 64, 91, 71. 75, 72 
Bi 42, 61, 52, 78, 69, 81. 75, 78, 78, 65 
A ES E E SE PH 
组 成 绩 的 中 位 数 相等 ,提问 的 次 序 对 学 生 的 成 绩 无 影响 , 若 中 位 数 
不 相等 则 不 敢 认 为 没有 影响 。 由 于 是 小 样本 ,并 且 为 两 个 独立 样 
本 ,因而 可 以 运用 M-W-W 检验 .这 是 一 个 单 侧 检验 , 单 侧 备 择 应 
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(4.2) 


Y A prize SAKES MAR ARE o SAER 
件 都 与 前 面 所 述 的 相同 时 ,应 用 Mann-Whitney-Wilcoxon 检验 的 
假设 可 以 写 为 
H: M, —M,= 4, 
Hi: M,—M,+4 
单 侧 检验 为 
Hy; M.—M,=0, Haa M,—M,=0 
H,; M.— M, > Ho; M,— M,<0, 
上 述 的 零 假 设 也 可 以 写成 
Ho: (M, 0) —M,=0 
RX — 0, By x En Y RS) a BP 
F (u) = F,(u — 0, 对 所 有 的 z 
ABZ M. y X HP M, 2S Y Bg BEC O, 就 是 MOM, H2 
B EX al =x— ds BD Xt x AY oe TREA x", = 21 一 Bra, = 
Xy — host sE m = Emn — Oy ABZ mA HHA Sn tY RNE 
序 , 分 别 给 以 相应 的 秩 ; 可 以 应 用 Mann-Whitney-Wilcoxon 检验 。 
检验 统计 量 
T. = 2) BRA 
E& T AE3X — REM P MEA ES A TET EYE RS — R6. 


$4.2 Wald-Wolfowitz 游程 检验 ~ 


Mann-Whitney- Wilcoxon 检验 主要 应 用 于 检验 两 个 样本 是 
香 来 自 具 有 相同 位 置 的 总 体 , 是 对 两 个 总 体 在 集中 趋势 方面 有 无 
差异 的 一 种 考察 ,而 不 研究 其 它 类 型 方面 的 差异 ,Wald-Wolfowitz 
游程 检验 则 可 以 考察 任何 一 种 着 异 ,Wald-Wolfowits Runs Test 
常 译 为 沃 尔 德 一 次 尔 福 威 获 连 申 检验 或 游程 检验 ， 简写 为 W-W 
申 检验 。 


一 基本 方法 


TUS X.Y 的 两 个 总 体 具有 连续 分 布 ,其 累积 分 布 酒 数 分 别 为 
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FoF, AS EA REE dee BUR RE , 即 检验 两 个 总 体 分 布 
相同 的 零 候 说 是 否 成 立 .建立 的 假说 组 为 
Ha FQGD =F,00 对 所 有 的 z 
Ai: EMO AF, XP a 
为 对 假设 作出 判定 ,需要 从 XX 中 随机 抽取 m DAI zi 2 Tes 
从 Y 了 中 随机 抽取 了 #4 个 数据 Y Y o Yo 数据 的 测量 层次 至 少 要 
基 定 序 尺 赚 ,将 两 个 独立 样本 的 mm 十 n= 二 和 N 个 数据 按 太 小 排列 , 即 
将 所 有 六 个 数据 排 成 一 个 有 序 的 序列 ,确定 这 个 序列 的 游程 数 ， 
记 就 是 连 串 数 。 一 个 游程 定义 为 取 自 同一 样本 的 一 串 相 连 的 数据 ， 
例如 ,观察 黄 组 学 生 的 考试 成 绩 如 下 
X. 72, 78, 63 
Y. 65, 79, 82, 85 
将 7 个 分 数 排列 成 一 个 从 小 到 天 的 序列 为 
63 65 72 78 79 82 85 
X Y X X Y Y Y 


观察 X.Y 出现 的 次 序 以 确定 游程 数 ,序列 中 有 4 个 游程 ;一 个 由 来 
H X AY 53 分 构成 的 游程 ,随后 是 一 个 由 来 自 Y 的 65 分 构成 的 游 
程 , 青 后 是 由 来 自 闵 的 两 个 分 数 78 和 72 构 成 的 游程 ,最 后 是 三 个 
来 自 了 的 分 数 构 成 的 1 个 游程 ,如 果 A, 为 真 , 则 两 个 样本 的 数据 
期 望 能 相互 混合 地 排列 ,游程 数 会 相对 较 大 ,车 了 的 游程 或 了 的 游 
E 过 长 ,也 就 是 来 自 同 一 总 体 的 数据 在 有 序 的 序列 中 过 多 的 相互 
连接 , 则 游程 数 将 会 相当 小 ,这 样 ,数据 将 不 支持 Hoa ATLA. BT A 
序列 的 游程 数 作为 检验 统计 量 .定义 芝 为 风 ald-Wolfowitz 检验 的 
统计 量 
U = MENE H 

ME PB. mt an= N S 20 时 ,与 单 样本 游程 检验 相同 ， 
在 附 表 WE cp. KR an 及 U 查找 相应 的 了 d. h T 
Wald-Wolfowitz 检验 通常 是 双 侧 检验 ,所 以 按 表 227 的 判定 指 
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SURE PR PERU mn = N > 20K m > 12, 
2 > 12.00 apt ees) APE 28 HAZ AER 2— 28 OY 
Wu Ardea AAS PAE. 


二 .应 用 


551.3]. 问题 的 提 疝 顺序 是 和 否 对 学 生 正 确 回 等 的 能 力 有 
影响 
祝 用 例 4.2 的 资料 ,考察 问题 的 气 问 顺序 是 否 对 学 生成 绩 产 
生 影 响 。 
分 析 : 由 王 只 考察 问题 从 易 到 难 排序 和 从 难 到 易 排 序 是 理会 
影 啊 学 生 的 成 绩 , 且 相互 独立 ,因此 可 以 用 Wald-Wolfowitez 游程 
检验 .假设 组 为 
Ho: F(a) = FG) 
Hy, Fu) x FG) 
甲 文 字 表述 为 
H: ”从 易 到 难 提 问 和 从 难 到 易 提 问 ,学 生 的 成 绩 没 有 差异 
Ai, 两 种 提问 顺序 会 造成 学 生 的 成 绩 有 差异 
将 实验 数据 即 学 生 考 试 成 绩 从 小 到 大 排序 得 到 
42 52 61 64 65 69 71 72 75 75 
Y Y Y X Y Y X X X Y 
78 78 78 81 82 83 84 90 91 98 
Y Y Y Y X X X X X X 


从 上 面 结 果 可 知 HE PUPA AE U = 6. ER VIL ye — 10, 
n —10,U = 6 A SE SS 0.019, E FERMES I P (Bv e 
2 X 0.019 = 0.038. 对 于 显著 性 水 平 & = 0.05, SR P ERBER, 
因 此 ,数据 不 支持 瑟 ,, 即 提问 的 顺序 对 学 生 正 确 问 管 侣 题 的 能 力 
有 影响 。 

72 


三 . 同 分 的 处 理 


采用 Wald-Wolfwitz 游程 检验 与 Mann-Whitney U 检验 一 - 
FÉ. 均 假 设 总 体 是 连续 分 布 ,因而 车 能 精确 测量 ,观察 值 不 会 有 辐 
分 出 现 . 但 实际 上 ,测量 有 时 很 礁 极 准确 ,所 以 常会 有 辐 分 出 现 , 如 
果 同 分 值 夹 自 同 一 个 祥 本 ,游程 数 上 0 不 会 受到 影响 ,如 例 4.3 中 来 
自 了 区 3 个 78 分 ,无 论 怎么 排序 都 是 构成 1 个 游程 .但 同 分 值 来 自 
两 个 样本 时 ,U0 就 可 能 会 受到 影响 ,并 影响 最 后 的 结论 . 例 4. 3 中 
的 两 个 75 分 ,分 别 来 自生 了 ,在 例 中 是 先 排 的 和 .再 排 了 。 若 来 自 了 
的 排 在 先 AX WHE. PE BAR RS 6. U = 
8。 在 附 表 MI p,m = 10,2 = 10,U = 8,P = 0.128 eee E, 
数据 支持 五。 得 出 与 前 面相 上 反 的 结论 。 在 运用 Wald-Woltowitz 游 
程 检验 时 ,车 同 分 值 来 自 两 个 不 同 祥 本 ,一 般 应 将 各 种 排序 的 可 
能 性 都 进行 考察 ,分 别 计算 每 种 情况 下 的 游程 总 数 上 ,并 查找 相应 
的 情 值 .如果 得 出 的 结论 一 致 ,表明 同 分 没有 带 来 什么 问题 ;如 果 
得 到 的 结论 不 一 致 ,可 以 将 几 个 已 值 求 简单 平均 数 , 以 此 作为 是 否 
拒绝 五 ,的 依据 ,如 例 4. 3 中 ,一 种 排序 的 已 一 0.019, 另 一 种 情况 
书 一 0.128. 则 可 取 二 者 的 简单 算 求 平均 数 (0. 128 + 0.019)/2 = 
0. 0735 作为 相应 的 P 值 ,决定 是 否 支 持 出 He BIRR P 
值 , 在 0.05 的 显著 性 水 平 上 ,数据 支持 RAE EA 
之 间 多 次 出 现 ,U 实际 上 是 不 确定 的 ,因而 不 宜 采 用 
. Wald-Wolfowitz 游程 检验 ，。 


$43 AFAR 
单 样本 的 X? 检验 方法 可 以 椎 广 到 对 两 个 独立 样本 的 总 体 差 
异性 的 检验 ， 
一 ,基本 方法 
”分别 从 两 个 分 布 钞 数 为 F(x) 和 F(x) 的 总 体 中 ,随机 柚 取 


m I Rs 个 样本 数据 ,利用 样本 值 推断 两 个 总 体 量 否 具 有 某 种 差 
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蜡 , 可 以 建立 假设 组 

Hur Ex) = Foz) 对 所 有 之 

Hi: Fi) x FIG WT x 
在 具体 研究 某 种 特性 的 差异 时 ,等 假设 和 备 择 假设 可 以 具体 化 .如 
检 验 不 同性 别 玫 童 对 电视 台 的 几 种 少儿 节目 是 否 有 伍 好 ,检验 不 
同 文化 程度 的 青年 对 职业 的 选择 有 亩 不 同 , 檀 验 不 司 性 别 的 学 生 
大 学 升学 率 是 否 有 差异 等 等 ,可 以 用 文字 表述 零 假设 和 备 择 假 设 。 

为 了 对 假设 作出 判定 .所 需要 的 数据 是 两 个 样本 ,测量 层次 

最 低 四 为 定 类 尺度 ,对 每 ~- 个 样本 的 数据 都 可 以 分 为 r 个 组 ,r > 
2. 若 第 一 个 样本 数据 各 个 组 的 观察 频数 分 别 记 作 Ao aros 
第 二 个 样本 各 组 的 观察 频数 分 别 记 作 万 : faa ,fs; 那 么 , 任 一 
样本 某 组 的 观察 频数 可 以 用 fj;, 表 示 , 其 中 i 二 1,2,… 7 f= 152, 
第 一 个 样本 的 观察 值 数 目 E, = ,第 二 个 样本 观察 值 数 目 E, 
=n, AP PRUE ERAN — n, 二 nn。 两 个 总 体 中 与 两 个 样 
本 观察 频数 相对 应 的 期 望 频数 分 别 记 作 Es Eat e 和 Ersen, 
er 第 :组 两 个 样本 的 观察 频数 和 记 作 F S 


Fi. 一 Fa + Fa 
WER, 为 真 ,那么 第 一 个 样本 第 i 组 的 期 望 频数 
€ 一 My (4. 3) 
第 二 个 样本 第 i 组 的 期 望 频数 为 
oN 
iz POM NTN ü 


于 是 ,两 个 样本 的 各 组 观察 频数 与 相应 的 期 望 频数 可 以 归纳 如 表 
4—4 A, HE MARS, 与 期 望 频数 ev MHS. AWS, 与 
2) 越 接近 , 即 其 差 值 越 小 ,表明 五 。 为 真 的 可 能 性 越 大 。 对 于 两 个 独 
立 样 本 ,可 以 用 (fo — en fen TOES — ea) lea 祥和 的 大 小 来 判定 
是 否 拒 绝 Ho, 

检验 统计 量 . 两 个 狸 立 样本 的 驴 拟 合 优 度 检 验 的 检验 统计 量 
定义 为 @, 它 由 下 式 计算 
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TETERA RP er rm mG o ———- 


Q= r Ga — e y 5 (f, — en) (4. 4) 
im] ey r=] En 
(4. 4) 式 筷 可 以 写成 
Fog — z 
Q= EE) (4. 5) 


im ge] £i 


ME Pia. SETTE ET UE I EI di RE df — 7 — 105 x? 4 HR. 
在 附 表 1 PRE ARAA EN  XETEZIOE o ERIR AA 
Er- 1) AFQS xi — D. QT dk TB xem E 
PER a HEW A, EZ .Q Xi 一 1), 则 不 能 拒绝 五 ,, 对 假设 
的 判定 还 可 以 这 样 进行 ,在 附 表 I 中 ,根据 df O, dE 五 。 成 立时 
AAA PAP ATRAEN EK e A LU A, E 
Hj 3E RAE RBA ZP 值 较 小 , 则 拒绝 五 ,。 


表 4 一 -4 x 检验 频数 表 
观察 频数 、 Eb 
组 A f: 合计 - ĉl es 
] fu fi f. nifi N fy. 一 en 
2 fn HT Fa. nfa d N fa. — en 
F Fa p f. nife N Fe — £n 
ei A Js N it] Fis 


AT B Br BEBSVGHEE A, ARA ATA Q Af 
fj B Br BEZE CI 50 式 中 独立 项 的 数目 . 判定 Fi(x) 是 否 等 于 
FG, SEBUR AG r 组 中 每 一 类 型 的 概率 ,因此 , (4.5) 式 待 估计 
的 参数 有 2r 个 .由 表 4 一 4 可 知 , 一 旦 + 行 确定 ,频数 ;项 数 被 确 
定 ,期 望 矣 数 中 有 一 个 确定 , 另 一 个 就 被 确定 ,因此 (4. 50 式 中 独 
开 项 的 数 为 2r — r — 1,0 抽样 分 布 的 自由 度 df = r — 1, 


二 .应 用 


C 514.4] 已 婚 和 独身 妇女 年 内 没有 工作 日 数 的 分 布 是 知 
. 75 


不 同 

已 婚 女 人 昆 否 比 独身 女人 更 容易 请 假 而 从 事 工 作 的 时 间 更 
少 。 这 里 没有 工作 的 对 太 不 包括 正常 的 休假 ,如 怀孕 ,住院 治 病 等 。 
那些 离婚 分居. 天 个 但 身边 无 子 辫 生活 在 一 起 的 , 均 列 入 独身 一 
Es ARE AE A I] s PG PLI SP E] MCI S ndi 100 ACRI 
200 人 进行 调查 ,结果 如 表 4 一 5 

is 已 婚 和 独身 妇女 年 内 无 工作 日 数 
无 工作 日 数 分 组 5 天) E EB CAD Th aC A 
a 60 136 


4 一 -了 21 50 
8—11 : 11 10 

12—15 4 6 

16—19 2 3 

20 以 上 2 1 
eit 100 200 


分 析 ;根据 所 研究 的 问题 ,可 以 建立 假设 组 
Ho 已 婚 和 独身 妇女 年 内 无 工作 日 数 分 布 相同 
Ha — 已 婚 和 独身 妇女 年 内 无 工作 日 数 分 布 有 差异 
.已 婚 妇 女 为 第 一 个 样本 ,独身 妇女 为 第 二 个 样本 ,xz 表示 没有 
”工作 的 天 数 , 利 用 尖 检 验 考 察 是 否 存在 差异 .Q@ 统 计量 计算 过 程 加 
Fe 4 一 6。 - 
与 单 样本 的 X? 检验 一 样 , 当 两 个 样本 中 无 论 本 一 个 的 革 一 组 
其 期 望 频 数 小 于 5 时 ,应 将 相 邻 组 合并 ,同时 另 一 祥 本 相应 的 两 组 
也 要 合并 ,以 保证 两 个 样本 的 组 数 相等 ,这 种 情况 下 ,原来 的 7 组 
被 减少 ,相应 地 自由 度 df 也 被 闫 少 ,在 这 个 问题 中 ,“16--19” 天 和 
“20 及 以 上 ”天 的 期 望 频数 均 较 小 ,将 其 合并 ,如 表 4 一 6 的 计算 那 
样 , 天 数 的 分 组 由 6 组 变 为 5 组 ,相应 地 自由 度 上 时 变 为 5 一 1 一 4. 
在 附 表 I 中 ,df 一 4a 一 0.05, XL o (4) = 9. 49, H F Q = 5.3395 
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<a OD 一 049 因此 ,调查 数据 支持 H AE AAC a 
= 0. 05 水 平 , 不 能 拒绝 A. CA SREP AR A LTETA 
A RA EA df 
= 4,Q = 5. 3395 AIR MH HES P — 0. 20, XX XP BS PERE a = 
0. 05 35 Vi, BA OEA AREA WS EIL 被 调查 数据 支持 的 结 
ie. 


表 4--6 Q 统计 量 计算 表 
z fi fy f. ei er (fiver? fey (faenas 
0—3 60 130 190 83.33 126.67 a. 1751 0.0875 
4—7 21 50 7] 23.67 47. 33 i. 3012 0. 1306 
&—11 11 10 21 7. 00 14. 00 2.2857 l- 1429 
12—15 4 b 10 3. 33 6. 67 O, 1348 9. 0673 


16—19 2 3 5 . 
je ja ja 2. 67 5.33 0.6625 9. 3319 
z0&H.lr a 


eid 100 200 300 3. 5593 l- 7802 


Q — 3.5593 + 1. 7802 = 5.8395 di=5-]=4 


$4.4 BARA HY Kolmogorov-Smirnov 检验 


单 样本 的 下 -5S 检 也 可 以 推广 应 用 于 两 个 独立 样本 。 两 样本 的 
K-S RRS X^ 检验 类 似 , 也 用 于 检验 总 体 分 布 是 否 相 同 。- 
一 .基本 方法 
两 个 连续 总 位 ,具有 累积 概率 分 布 分 别 为 下 (zr) 和 F(x) ,要 
检验 两 个 总 体 分 布 是 否 相 辣 ,建立 的 假设 组 为 
Ho: Fix) = Flr) MAPA c 
Hi, F(x) x Fx) RET x 
Pa RS ABBE PE 8 AE AA A REL XE PET hr E 
本 ,数据 大 小 分 别 记 作 mn RE RKB RR, 
若是 定 序 发 度 ,项 能 确定 两 个 样本 观察 值 相对 差 值 的 大 小 ,两 个 样 
77 


Hi. 两 地 区 青年 人 的 文化 程度 分 布 有 差 红 

由 于 两 个 地 区 抽 选 的 样本 可 视 为 独立 的 , 且 数 据 是 四 个 以 上 
定 序 资料 组 ,易于 应 用 ROS 恰 验 . 两 个 样本 的 大 小 不 等 ,因为 4 地 
民 的 样本 数目 较 少 ,作为 第 一 个 样本 天 一 236, 则 已 地 区 为 第 二 个 
样本 := 一 274。 计 算 检 验 统计 量 忆 的 过 程 如 表 4 一 8, 由 表 可 知 


E 4 一 8 检验 统计 量 D Bop NC 
B "UT ETT 经验 分 布 函 数 
Site) = Sia = |S, tr) 一 
Df EA Ef, fm "m T 

WIRE _ 

gi 58 31 58 31 0. 2458 0. 1131 0. 1327 
小 学 51 48 109 77 0. 4619 0. 2810 0. 1809 
初 中 47 53 188 130 0.6610 0. 4745 0. 1865 
PERA 44 73 200 203 0.8475 0.7409 0. 1066 
X + 22 5] 222 254 0. 9408 0. 9270 0. 0138 
大专 以 上 14 20 236 274 1. 0000 1. 0000 1. 0000 
合 it 236 274 


D = max|$,(r) — S,Cr)| = 0.1865 


HF omo 均 较 大 ,为 大 样本 ,在 附 表 Xi 中 需 先 计算 VN mn 
AWB AIM PA, m = 236.1 = 274,N =m + n = 510, 
VN /mn = 0. 0888.24 P = 0. 010 Ft, I FU 

1.63 /N/mn 一 63(0. 0888) = 0. 1448 
AyD = 0.1865, 大 于 这 个 临界 值 .所 以 , 渐 近 的 近似 值 是 已 一 
0. 01 .显然 对 于 显著 性 水 平一 0.05( 或 9.01)P 值 驶 小 ,因而 数据 
AB SRF 五 。. 检 验 结 果 表 明 , 两 个 地 区 青年 人 的 文化 程度 分 布 存在 
着 明显 的 差异 。 
[ 514.012. 城郊 县 是 否 比 边远 县 有 较 低 的 人 人 口 增长 速度 
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表 4 一 ?9 检验 统计 是 的 计算 表 


AFB eR DEA 六 EA Ef, Siir) Air) Sifr) — Slr) 

0 RA io 1. 0 47 0 1/7 
2.7 】 0 2 n 2/7 ù 2/7 
3.1 1 a 3 9 3/7 0 3/7 
3.2 1 o 4 g 4/7 0 4/7 
3.4 1 0 5 Q 5/7 ue 5/7 
3.5 o 1 5 H 5/7 1/9 38/63 
3.7 2 I 5 2 5/7 2/9 31/83 
4.8 o0 1] 5 3 5/7 3/9 24/63 
5.3 9 1 5 4 5/7 4/8 17/63 
5.8 o I 5 5 5/7 5/9 10/63 
5.8 o 1 5 6 S/T 6/9 3/63 
6.8 o 1 5 7 5/7 7/9 — 4/63 
7.9 1 06 6 7 6/7 7/9 5/63 
8.2 1 Q0 7 7 1 7/9 2/9 
9.3 0 1 7 8 1 8/9 1/9 
10.3 0 1 7 9 1 1 0 

三 , 几 种 检验 的 比较 


两 个 独立 样本 的 非 参 数 检验 ,都 是 检验 两 个 独立 样本 是 否 可 
能 来 自问 一 个 总 体 ,但 是 各 种 检验 方法 对 祥 本 间 不 同类 型 差异 的 
敏感 程度 不 一 样 ,车 研究 的 是 两 个 样本 是 否 代 表 位 置 ( 集 中 趋势) 
有 差异 的 总 体 , 应 选择 对 这 种 差异 最 敏感 的 检验 方法 .如 
Mann-Whitney-Wilcoxon 检验 ,Kolmogorov-Smirnaov 检验 (BL 
BM). 在 样本 容量 较 大 或 测量 层次 较 低 时 ,， 可 以 采用 
Mann-Whitney-Wilcoxon 检验 , 它 是 专门 揭 示 位 置 是 否 有 差异 的 
EV, 如 果 样 本 容量 非常 小 . 或 者 同 分 铁 较 多 , 不 便于 应 用 
Mann-Whitney-Wilcoxon 检验 时 ， Kolmogorov-Smirnov RIEU 
检 验 稍为 有 效 一 些 。. 如 果 研 究 揭 是 两 个 样本 是 否 代 表 任 一 方面 有 
差异 的 总 体 , 如 位 置 、 离散 度 、 偏 斜 度 等 等 , 可 以 选用 闪 检 验 、 
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Kolmogorov-Smirnov 438 (XX fll) , Wald-Wolfowitz 检验 。 当 被 分 
HSE Be KARE, 只 能 采用 站 检验 .者 被 评价 的 
总 体 是 连续 分 布 的 ,可 选用 Wald-Wolfowitz 检验 或 Kolmogorov- 
Smirnov 失 验 ,一 般 来 说 ,Kolmogorov-Smirnov 检验 要 比 Wald- 
Wolfowitz 检验 更 有 效 , 当 数据 不 满足 连续 性 假定 时 , 它 仍然 可 以 
适用 , 只 是 得 到 的 成 值 将 比 诬 得 到 的 稍 友 些 , 也 就 是 说 犯 第 工 类 
错误 的 楼 率 会 稍 梢 增 大 。 
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第 五 章 个 相关 样本 的 非 参数 检验 


在 参数 统计 中 ,检验 儿 个 样本 是 和 否 来 自 完全 相同 的 总 体 , 采 
用 方差 分 析 或 下 检验 .运用 下 检验 的 假定 条 件 是 :样本 是 从 正 态 分 
布 的 总 体 中 独立 抽 选 的 ;总 体 具 有 相同 的 方差 ;数据 的 测量 层次 至 
少 是 定 距 尺度 。 当 被 用 来 分 析 的 数据 不 符合 这 些 假定 条 件 ,或 研究 
者 不 希望 作 这 些 假 设 , 以 便 增 加 结论 的 普遍 性 时 ,不 宣 来 用 参数 统 
计 的 方法 ,而 必须 运用 非 参 数 方法 。 

RUF RSE FRAT 3) 个 样本 是 按 某 种 或 菜 些 条 和 件 丐 配 的 , 那 
么 上 & 个 样本 称 为 相关 的 ,否则 为 独立 的 。& 个 相关 和 独立 样本 的 差 
别 与 两 个 相关 和 独立 样本 之 间 的 差别 类 似 。 本 章 介 绍 丰 个 相关 样 
本 的 非 参 数 检验 。 


$5.1 Cochran Q 检验 


Cochran Q 检验 也 译 为 科 库 兰 检验 。 它 是 用 以 检验 匹配 的 三 
组 或 三 组 以 上 的 频数 或 比例 之 问 有 无 显著 差异 的 方法 .这 种 匹配 
可 以 用 不 同形 式 获 得 .例如 ,检验 三 种 不 同类 型 的 采访 形式 对 被 采 
访 者 的 有 效 回 答 是 和 否 有 影响 ,可 以 抽 选 一 些 人 ,分 成 ”组 ,每 组 有 3 
个 匹配 的 被 采访 者 ,要 求 他 们 的 有 关 情 况 相 同 ,每 组 的 3 名 成 员 被 
随 机 地 置 于 3 种 条 件 之 下 , 即 分 别 接受 三 种 类 型 的 采访 ,于 是 ,就 
获得 了 3 个 匹配 的 样本 ,由 = 3, 每 个 样本 有 x 个 观测 结果 .k 个 
相关 样本 也 可 以 采用 同一 组 人 ,对 不 同 的 站 个 条 件 的 反应 匹配 成 
样本 ,这 类 做 于 两 个 相关 样本 中 以 研究 对 象 作为 自身 的 对 照 者 , 例 
如 ,检验 几 种 教学 手段 对 学 生 掌 握 知识 基 否 有 显著 不 同 ,可 以 随机 
抽取 个 学 生 , 让 他 们 先后 置 于 上 种 教学 手段 之 下 ,再 作出 评价 。 
这 样 可 以 获得 个 匹配 的 样本 ,每 个 样本 有 x 个 观测 结果 。 
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一 、 基 本 方法 


车 有 证 个 相关 样本 ,每 个 样本 有 个 观测 结果 ,检验 个 样本 
间 是 否 有 显著 差异 ,可 以 建立 双 侧 备 择 ,假设 组 为 
Ay, 让 个 样本 间 无 显著 差异 
H,. 点 个 样本 间 有 显著 差异 
由 于 三 个 及 三 个 以 上 样本 图 差异 的 方向 不 便于 判定 ,因而 ,通常 只 
BMS ERENT 
HABEAS R RME ERA ER BY BT. 
K GE RE HE — s frk WHR. HS 为 真 ,那么 将 测量 
结果 分 为 "成功 ” 和 ”失败 ”的 话 光 成 功 ” 与 “失败 ”应 随机 她 分 布 
EH PHBA BA Cochran Q 检验 的 统计 量 定义 为 
a- vade - dr 


it n (5. 1? 
ad 
式 中 ,+ 是 第 j 列 的 总 数 ,y; 是 第 i 行 的 总 数 .由 于 已 统计 量 的 抽样 
St AULA H EL BE dE = k — 185 x? 18 TARR ELI BE df = 4 
MES USE 1 中 查找 临界 信 XL 
Q 2% 
UAE S HEAP a PIERA RAMA BE aE Se REA. 
反 , 则 不 能 拒绝 Ho, 
二 .应 用 
O 消费 者 对 饮料 的 爱好 是 否 存在 差异 
某 商 店 为 决定 经 营 饮料 的 品种 .数量 ,对 消费 者 的 爱好 进行 了 
一 次 调查 .随机 抽取 18 个 消费 者 ,请 他 们 对 四 种 饮料 LPS LR 


35. Sir. O TAR REA EEE 1 ARCE 
9。 调查 结果 如 表 5 一 1。 


RA 


表 5 一 1 消费 者 对 饮料 宣 好 的 调查 结果 
酸奶 ES 


HEM Sita ] 


L l 0 0 ] 2 
2 0 0 1 a 1 

3 0 ë 1 1 2 

4 1 1 0 ü 2 

5 } Ü 1 0 2 

6 0 ] 0 0 1 

7 0 o 0 1 1 

8 0 1 0 0 1 

$ 0 1 1 " 2 

10 1 1 1 0 3 

11 o o 1 ü 1 

12 0 Ü 1 0 1 

13 i ü o 1 2 

14 1 1 0 0 2 

15 1 1 0 0 2. 

16 0 1 0 g l 

17 1 0 0 1 2 . 
18 0 o o 1 1 


分 析 : 为 检验 消费 者 对 四 种 饮料 的 爱好 是 否 有 差异 ,建立 双 

- 侧 备 择 ,假设 组 为 

Ho 消费 者 对 四 种 饮料 爱好 无 差异 

Hy, 消费 者 对 四 种 饮料 爱好 有 差异 | 
由 于 数据 为 定 类 尺度 测量 ,只 有 “爱好 ”与 “不 爱好 ”两 种 结果 H 
是 两 个 以 上 相关 样本 ,这 里 是 四 种 饮料 , 一 4, 所 以 选用 Cochran 
Qiu. 
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RGR eo 1 UAE A E e 一 8 


ARDER DAA FAR — 8 AA 


数 .同样 地 ,zs = 7n, 二 6, 分 别 表示 消费 者 害 欢 果汁 ,可口可乐 的 
BRE La, = 29 是 折 有 四 种 饮料 中 ,消费 者 表示 喜欢 的 总 次 数 。 
y. 是 第 ? 个 消费 者 喜欢 各 种 饮料 的 次 数 .y, = 29, 是 各 个 消费 者 
对 四 种 饮料 表示 喜欢 的 总 次 数 。3z, 表示 按 样本 数 计算 的 消费 者 
喜欢 的 总 次 数 , 而 Xy 表示 按 观察 对 象 即 消费 者 或 说 按 样品 数 计 
算 的 对 各 种 饮料 喜欢 的 总 次 数 ,这 两 个 总 和 应 相等 , 即 有 2 = 


Èy. tr Hi Q 正 是 用 于 说 明 按 样本 数 计算 的 总 次 数 与 按 样品 数 计 


算 的 总 深 数 的 符合 程度 ., 按 (5. 1) 式 ， 
— (4— D[ACA + 64 十 49 + 36) — 29] 
i 4€29) — [90250 4-807» 十 37] 
_ 8[852 — 841. 
116 — 53 
= 0.5238 
根据 给 定 的 显著 性 水 平 < = 0.05. FE d£—4—1-— 3.38 
附 表 I ,得 到 临界 值 类 = 7.82. 显 然 ,@@ 一 0.5238 < X= 7.82, 
因而 ,调查 数据 在 5% 的 显著 性 水 平 上 不 能 拒绝 吾 ,, 即 消费 者 对 
四 种 饮料 的 爱好 没有 显著 差异 。 
【 例 5.2 三 种 不 同 教学 方法 的 效果 是 否 有 显著 差异 
三 种 不 同 教学 方法 ;电视 教学 .课堂 讲授 , 温 堂 讨论 ,对 学 生 掌 
握 知 识 的 效果 是 否 有 所 不 同 .为 检验 这 一 问题 , 抽 选 部 分 学 生 分 为 
18 组 ,每 组 3 名 匹配 的 学 生 ,他 们 的 有 关 情 况 类 似 。 各 组 中 3 名 学 
生 被 随机 地 置 于 3 种 条 件 下 , 即 随机 地 指定 接受 某 种 教学 方法 . 实 
施 不 同 教学 方法 后 进行 测验 ,成 绩 合 格 为 有 效 , 记 作 1; 成 绩 不 合 
格 为 无 效 , 记 作 0,28 5 fm de 5— 2, 
分 析 : 学 生 的 考试 成 绩 是 定 距 尺度 测量 ,这 里 将 其 转化 为 合 
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格 、 不 合格 两 类 , 则 视 为 定 类 尺度 .合格 即 教学 方法 有 效 为 1 ,不合 
格 为 教学 方法 无 效 , 记 作 0. 接受 三 种 不 同 教学 方法 的 学 生 在 每 一 
组 是 匹配 的 , 即 梅 戌 3 个 相关 伴 本 ,二 3. 检 验 三 种 教学 方法 的 效 
FAA A ,建立 的 假设 组 为 
,三 种 教学 方法 的 效果 无 显著 差异 
Hi: 三 种 教学 方法 的 效果 有 显著 差异 
表 5-2 实施 不 同 教学 方法 的 学 生成 绩 


BRAF REE ei | 合计 ty.) 


1 0 o 0 0 
2 Ü 1 1 2 
3 0 1 ü 1 
4 Q Ü 0 Q 
5 1 ü 1 2 
E o 1 1 È 
了 o 1 1 2 
8 th i ü 1 
9 1 Ü 1 2 
10 ù a Ü G 
11 a i 1 2 
12 Ü l 1 之 
13 a 1 i 2 
14 o 1 1 2 
15 1 1 2 
16 1 1 1 3 
17 0 a i 1 
18 Ü 1 1 2 


fitt) | 3 12 13 28 


由 于 是 定 类 尺度 测量 的 数据 ,相关 样本 数目 天 于 2, RE, E 
38 


3X Hl Cochran @ 检验， 
利用 表 5 一 2 的 数据 计算 丛 验 统计 量 名 

_ —D[3(34+ 12? + 13%) 一 287] 

|. 8280 — [11422 + 30312 + 3*] 

.. 2[3(322) — 784] 

84 — 56 
= 13 
给 定 显著 性 水 平 a = 0.05, df 一 3 一 1 = 2,2: I 中 相应 
RÍE Y. 5.99, PSR, = 13 > x2 = 5. 99,78 5% 的 显著 福永 
PLA EA OY, FE = A AE EY a gu 
F RUG AGE GRR Aa. ERE 1 ,对 于 自由 度 df 
=3-~1= 2,76. 为 真 时 ,Q > 13 i SOM ARR PESE 0. 01.5% 
一 概率 显然 小 于 显著 性 水 平 a = 0.05, 也 小 于 显著 性 水 平 = 
0.01, 因 此 QQ 秆 位 于 否定 域内 ,调查 结果 拒 纺 Bo, 
运用 Cochran 有 @ 检 验 时 应 注意 ,只 有 当 行 数 7 不 太 小 时 , 忆 的 

抽样 分 布 才 近 似 于 df 二 让 一 1 的 x 六 分 布 .但 是 ,n 的 最 小 数 秆 目前 
并 没有 明确 的 说 明 , 使 用 者 采用 时 视 具 体 问题 而 定 .Cochran Q && 
验 适用 于 定 类 尺度 测量 的 数据 ,其 它 测量 层次 的 数据 也 可 以 运用 ， 
但 要 象 例 S. 2 那样 ,转化 为 两 类 ,但 这 样 做 可 能 浪费 数据 中 包含 的 
信息 。 因 此 ,Cochran Q 检验 一 般 只 用 于 定 类 尺度 的 数据 ，。 


$5.2 Friedman 检验 


Friedman 检验 亦 称 佛 利得 曼 的 禄 检验 .或 佛 利得 曼 双 向 评 秩 
方差 分 析 。 它 是 对 个 样本 是 否 来 自 同一 总 体 的 检验 .个 样本 是 
匹配 的 ,实现 匹配 的 方法 与 前 面 类 似 , 可 以 是 个 条 件 下 同一 组 受 
ik 者 构成 , 即 受 试 对 象 作为 自身 的 对 照 虱 ,也 可 以 将 受 试 者 分 为 
个 组 ,每 组 均 有 个 匹配 的 受 试 者 ,随机 地 将 个 受 试 者 置 于 个 
条 件 之 下 形成 ,在 不 同 受 试 者 匹配 的 样本 中 ,应 尽量 使 不 同 受 试 者 
的 有 关 央 素 匹 配 即 相 似 。 
89 


— BEAK 


与 Cochran Q 检验 相似 ,Friedman 检验 也 是 用 来 检验 各 个 样 
本 所 得 的 结果 在 整体 上 是 和 否 存 在 显著 差异 .因此 建立 的 也 是 驱 铀 
备 择 ,假设 组 为 
Hy, 大 个 样本 间 无 显著 差异 
H, 个 样本 间 有 显著 差异 
为 对 假设 作出 判定 ,所 分 析 的 数据 应 是 定 序 尺度 测量 ,获得 
的 数据 排 成 一 个 1 行列 的 表 , 行 代表 不 同 的 受 试 者 或 匹配 的 受 
斌 小 组 , 列 代 表 各 种 条 件 。 由 于 是 定 序 尺度 测量 的 数据 ,因此 ,可 以 
对 每 一 行 的 观测 结果 分 别 评 秩 , 邵 评 等 级 ,等 级 1 是 最 小 的 ,依次 
排序 , 秩 从 1 SUR WRH, 为 真 ,那么 每 一 列 中 鞭 的 分 布 应 该 是 随 
机 的 , 即 各 个 秩 出 现在 所 有 列 中 的 频数 应 几乎 相等 ,也 就 是 说 各 
列 的 秩 和 应 该 大 致 相等 .Friedman 检验 定义 的 统计 量 为 闻 。 


xX = ee — 3n(k — 1) i (5. 2) 
式 中 ， R 是 第 ; 列 的 秩 和 , 即 等 级 和 ,x 的 抽样 分 布 在 n.& 不 太 小 
时 ,近似 于 自由 度 df = à — 1 的 好 分 布 .因此 ,在 附 表 1 中 ,可 以 
根据 给 定 的 显著 性 水 平 a, 自 出 度 红 二 一 1 查 得 吾 , 为 真 时 ,相应 
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二 .应 用 


【 例 5.3】 三 种 不 同 教学 方法 的 效果 是 否 有 显著 差异 

三 种 不 同 教学 方法 同 例 5. 2, 抽 选 的 学 生 型 分 为 18 组 ,每 组 3 
名 匹配 的 学 生 , 其 有 关 情 况 类 似 , 各 组 中 3 名 学 生 被 随机 地 安排 接 
受 某 种 教学 方法 。 实 施 不 同 教学 方法 后 ,进行 测验 , 按 成 绩 高 低 对 
3 名 匹配 学 生 的 成 绩 排 列 等 级 即 评 秩 ,结果 如 表 5 一 3。 

分 析 :这 个 问题 与 例 5.2 类 伺 , 也 是 检验 三 种 教学 方法 的 效果 
有 无 差异 , 困 而 应 建立 双 侧 备 择 ,假设 组 为 
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如 ,三 种 学 方法 的 效果 无 显著 差异 
H 


1: ”三 种 教学 方法 的 效果 有 显著 差异 
表 5 一 3 ”实施 不 同 教学 方法 的 学 生成 绩 等 级 
PEH 电视 教学 课堂 讲授 课堂 讨论 
Ba 
2 1 2 3 
3 2 3 1 
4 3 2 1 
5 2 1 3 
6 1 3 2 
7 1 2 3 
8 2 3 1 
9 2 1 3 
10 2 1 3 
11 1 3 2 
12 1 3 2 
13 1 2 3 
14 1 3 2 
15 1 2.5 2.5 
16 1 2 3 
17 1 2 3 
18 1 2 3 
合计 (县 25 40.5 42.5 


El PRE CAMA ERRE, HER PU Ee 
本 , 故 可 以 采用 Friedman 检验 。 
根据 表 5 一 3 的 数据 , 按 (5. 2) 式 计 算 检 验 统计 量 好， 


12 


i 
2 z o 
X = chk Po — nh + D 
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— 0022 gag 3 十 42, 87) — 808)(3 +1) 
= jae 4 1 c 40.5 42 


— 226.8 — 216 — 10.8 

给 定 显著 性 水 平一 0.05, 自 由 度 df —&—1-2.2 [8 | 
HY, 成 立时 厚 应 的 临界 值 x:5.99.8 5.32 = 10.8 > = 
5. 99 ,因此 数据 在 5% 的 显著 性 水 平 上 拒绝 五 ,, 三 种 教学 方法 的 

K 5 一 3 中 ,第 15 组 接受 课堂 讲授 和 课堂 讨论 方法 的 学 生 济 
验 成 绩 相 同 ,因此 排序 时 , 取 秩 2 和 3 药 平 均值 , 均 记 为 2.5. 以 平 
LPR BE IS] AE ,不 影响 这 一 检验 的 有 效 性 。 

[5045.43 四 部 分 技术 训练 的 有 效 性 有 无 差异 


3 5 一 : 学 员 受 训 后 检测 的 成 夸 

FARS ”技术 训练 DO TRU L RARA X 技术 训练 
1 10 3 6 8 
2 了 5 3 4 
à 4 10 3 a 
4 6 3 16 4 
5 3 4 10 6 
6 5 4 8 T 
7 ‘ 1 10 6 5 
8 6 10 3 5 
9 10 5 T 6 
10 E: 5 T 5 
11 5 4 p 6 
12 3 5 4 7 
13 4 5 10 9 
14 é & 10 


某 田 径 队 对 新 入 队 的 学 员 要 进行 四 个 部 分 的 技术 训练 ,以 提 
高 学 员 的 身体 素质 ,为 检验 这 四 个 部 分 的 技术 训练 计划 是 否 确实 
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= 210. 7714 — 210 — 0. 7714 
在 附 表 1 H, HRS m eke « — 0.05. 6 ae df — 4 — 
1 = 3 相对 应 的 痢 界 值 兴 二 7.82.59 5 Q —0.7714 « X: — 7.82, 
调查 结果 在 5% 的 显著 性 水 平 上 不 能 拒绝 五 ,表明 四 个 技术 训练 
的 有 效 性 没有 显著 差异 。 


= Cochran Q 检验 与 Friedman 检验 


这 两 个 检验 都 用 于 & 个 相关 样本 是 否 可 能 来 自 同 一 个 总 体 的 
检验. 但 对 数据 测量 层次 的 要 求 不 同 。 当 数据 为 定 类 尺度 测量 ,只 
能 运用 Cochran @ 和 检验, 因为 ,这 一 检验 对 于 定 类 尺度 或 仅 分 为 两 
类 的 定 序 尺 度 测量 数据 是 极为 有 效 的 ,车 数据 测量 层次 至 少 为 定 
序 尺 度 时 ,应 优先 选用 Friedman X? 检验 ,因为 车 将 定 序 尺度 转换 
为 定 类 尺度 ,而 采用 Cochran Q 检验 ,可 能 会 浪费 数据 包含 的 信 
息 。 
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六 章 个 独立 样本 的 非 参数 检验 


在 统计 的 分 析 研 究 中 ,常常 需要 确定 * 个 独立 样本 是 否 来 自 
同一 总 体 或 从 个 相同 总 栖 中 抽取 ,通常 用 以 检验 这 一 问题 的 参 
数 方 法 是 单 向 方差 分 析 和 下 检验 ,运用 参数 方法 的 假设 如 第 五 章 
所 述 ,而 实际 分 析 的 数据 往往 并 不 具备 这 些 条 件 或 不 必要 加 以 限 
制 而 使 结论 更 有 普遍 意义 .这 时 ,不 能 运用 参数 方法 ,而 只 能 采用 
非 参 数 方法 ,本章 介 绍 几 种 名 个 独立 样本 的 非 参数 检验 方法 。 


$ 6.1 Kruskal-Wallis 检验 


Kruskal-Wallis 检验 亦 有 译 为 克拉 夏 尔 - 瓦 里 斯 检验 ,或 简称 
为 弄 氏 检验 。 它 是 两 个 独立 样本 Mann-Whitney-Wileoxon 检验 的 
一 种 推广 。 


一 .基本 方法 


ARRE, 各自 的 连续 累积 分 布尔 数 为 F(x) ,F(x)， 
EC 那么 Kruskal-Wallis 检验 的 一 般 零 假设 为 
Ho Fila) =F (0 =F (x) ”对 所 有 x 
如 果 在 研究 总 体 是 和 否 相 同时 ,偏重 于 考察 位 置 参 数 , 并 且 位 置 参数 
采用 各 个 总 体 竟 中 位 数 , 即 么 ,五 , 等 从 于 二 个 总 体 的 中 位 数 相 等 。 
若 仍 以 M, Mas M, 代表 x 个 SPR A Fz Be M Kruskal-Wallis 
检验 建立 的 假设 组 为 
Hoy: M, = M, = "= = M; 
Hi MG 1,2,-5,5) 中 至 少 有 两 个 不 相等 
这 里 的 备 择 对 于 & > 2 时 不 存在 单个 备 择 的 配对 ,因为 对 于 MG 
二 1,2-"… HER AL 一 上 C4 一 1)*…(1) 种 不 同 的 有 序 排列 ,这 不 
便于 进行 检验 。 
为 对 假设 作出 判定 ,需要 的 数据 是 上 个 独立 的 随机 样本 ,其 大 
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种 方法 有 效 性 是 否 有 差异 ,可 以 建立 假设 组 为 
Ho: M, = M, = M, = M, 
Hi: MG 1,2,8,4) PEDE MTE 
由 于 数据 是 定 序 尺度 测量 ,有 两 个 以 上 独立 样本 ,因此 可 以 
RA Kruskal-Wallis 检验 ,根据 表 6 一 1 的 数据 , 按 (6. D 式 计算 检 
验 统计 量 H. 


12 260* 122^ , 90 , 384 

~ 40(40 + D 10 19 10 10 
— 340 +1) 

== 31. 89 


HIRE I 中 ,与 df =k — 1 = 3, EXPERTA e = 0.05 相对 
RBS TB XS = 7. 82, E = 31.89 > x? = 7.82. EE 5% 
的 显 着 性 水 平 上 拒绝 号 ,表明 四 种 不 同治 疗 方法 对 精神 错乱 的 有 
效 性 存在 显著 差异 。 

[ 506.21. 四 种 培训 方案 的 有 效 性 是 否 存 在 显著 差异 

为 培训 大 学 生 志 愿 者 为 社区 服务 ,设计 了 4 种 培训 方案 , 记 作 
ABCD HRA 30 名 大 学 生 随 机 地 分 为 4 组 ,分 别 接受 不 同 
培训 .训练 一 周 后 , 按 规 定 的 要 求 考试 ,评定 的 成 绩 如 表 6 一 2 

表 6-2 志愿 者 培训 后 考试 成 线 


60 72 81 63 
75 52 85 58 
62 68 78 85 
76 82 56 71 
78 74 70 84 
98 64 59 77 
86 87 69 80 

79 89 


分析: 对 志愿 者 实施 四 种 培训 方案 后 测试 的 成 绩 是 定 距 尺度 
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的 分 数 ,可 以 将 其 接 从 小 到 大 的 次 序 给 予 适当 的 等 级 。 将 所 有 30 
名 大学生 志愿 者 的 成 绩 混 合 排 列 , 逐 个 评 秩 ,结果 如 表 6 一 3。 由 于 
数据 可 以 评 秩 , 样 本 为 4 个 独立 样本 ,可 以 采用 Kruskal-Wallis fi 
验 。 以 各 样本 的 中 位 数 是 否 相 等 作为 判定 四 种 方案 有 效 性 是 否 存 
在 差异 的 标志 。 建 立 的 假设 组 为 


家 6 一 3 志愿 者 成 绩 的 等 级 
培训 方案 4 BWA BIARC IFR D 
4 15 5 7 
18 1 26 2 
6 11 21 5 
19 24 10 14 
16 17 13 25 
30 8 3 20 
27 28 12 23 
22 29 
fir 120 104 112 129 


Ha M,—-M,—-M,—M, 
Hua M,G 二 上 ,2,3,4) 中 至 少 有 两 个 不 等 
利用 表 6 一 3 的 秩 次 和 ，, 按 (6. 2) 式 计算 统计 量 H , 19 


_ 12 1205 , 104 , 112% , 129 

H = 360 F D 7 7 8 ^ gj 8604 Dd 
= 93.5537 — 93 
= 0. 5537 


附 表 工 中 ,显著 性 水 平一 0. 05, db = 二 一 1 一 3 时 ,临界 值 % = 
7.82, IR SR H = 0.5537 之 六 一 7.82, 数 据 在 5 色 的 显著 性 水 平 上 
不 能 拒绝 五 , ,表明 四 种 培训 方案 的 有 效 性 没有 什么 显著 差异 ,最 
后 的 判定 也 可 以 通过 己 值 与 显著 性 水 平 z 比较 得 到 , 附 表 I 中 ,与 
df —&—1-—3,H = 0.5537 相对 应 的 概率 是 已 全 0.90。 显 然 HI, 
Ag EH = 0.5537 出 现 的 概率 远 远 大 于 显著 性 水 平 = 0. 05, 
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因此 ,同样 可 以 作出 结论 ,调查 数据 在 5 多 的 显著 性 水 平 上 不 能 拒 
aa Ho. 


三 、 同 分 的 处 理 


例 6. 2 中 的 每 个 志愿 者 成 绩 均 不 相同 :因而 没有 同 分 癌 题 1B 
在 实际 中 ,往往 会 出 现 评分 相同 的 情况 .如 时 在 两 个 或 两 个 以 上 的 
评分 之 间 出 现 则 分 时 ,每 一 个 评分 的 秩 都 记 作 这 些 同 分 秩 的 平均 
值 ,由 于 出 现 同 分 会 对 统计 量 瑟 有 影 啊 , 因 而 计算 瑟 值 时 ,应 进行 
校正 .校正 系数 为 ; 
Zu — Xu 


l— NON? 4 10D (6. 3) 

Xr ow 是 相同 评分 的 观察 值 数目 ,如 学 员 考 试 成 绩 有 2 个 92 
分 , 则 一 2 还 有 4 个 78 分 , 则 = 一 4 等 等 .计算 所 值 时 ,利用 
(6. 2) ABRIL (6. 3) 式 , 得 到 的 是 校正 的 五 值 。 经 过 校正 以 后 已 值 
比 校正 前 要 大 .如 果 未 校正 时 ,计算 结果 就 能 拒绝 ' 万 , ,那么 校正 后 ， 
将 在 更 加 可 刻 的 显著 性 水 平 上 第 绝 Ho BASRA EE 值 相对 
应 的 概率 刀 值 将 更 小 。 在 大 多 数 情况 下 ,这 一 校正 常 可 抱 略 .根据 
Kruskal 和 Wallis 在 1952 年 的 著作 中 证 明 , 当 同 分 的 观察 值 数目 
占 观察 值 总 数目 的 比例 不 到 25% 时 ,校正 后 的 概率 仅仅 改变 百 分 
之 十 几 . 一 般 情 况 , 校 正 因子 的 大 小 取决 于 # 值 的 大 小 , 即 同 分 的 
数目 和 同 分 观察 值 数 目 占 观察 值 总 数 的 百分比 。 

[ 566.31. 三 种 不 同 教学 方法 的 有 效 性 是 否 有 显著 差异 

某 大 学 制定 三 种 不 同 的 教学 方法 :大 班 讲 授 , 小 组 讲授 .小 组 
讨论 .为 检验 三 种 方法 对 学 生 掌 握 知 识 的 有 效 性 是 否 相同 ,进行 了 
一 次 试验 ,选取 二 年 级 大 学 生 50 名 ,随机 地 分 为 三 组 ,分 别 接受 三 
种 不 同方 法 教学 ,由 同一 教师 接 不 同方 法 分 别 讲授 同 一 方面 的 知 
识 , 规 定 的 内 容 讲授 完 后 ,对 学 生 进 行 统一 考试 ,成 绩 如 表 6 一 4， 
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3€ 6-4 SEE SE GC REIN 


ABE REACTED ARGH CO 小 组 讨论 组 (五 ) 
62 73.58 73 84 
56 79 48 78 86 
62 89 64 92 98 
84 98 72 86 72 
90 92 78 84 69 
48 52 84 69 79 
49 54 86 73 86 
54 84 92 92 34 
69 82 98 98 70 
72 69 62 - 81 90 


BAR iE HE RARE EEE EA TRE, 
ELS the WE RRE, AUREA RAS RES ze XE FE dE SS 
数 榨 验 .由 于 三 种 不 则 教学 方法 是 独立 的 , 故 应 采用 睛 个 独立 样本 
的 统计 粒 验 ,对 于 三 组 学 生成 绩 集 中 趋势 的 一 个 很 好 的 度量 指标 
是 中 位 数 ,成 绩 可 以 由 小 到 大 排序 给 出 等 级 , 因此 能 够 采用 
Kruskal-Wallis 检验 .建立 假设 组 为 
Hau M, =M, =M, 
H: MG=1,230 中 至 少 有 两 个 不 等 
若 用 文字 描述 为 
Hoe 接受 不 同 教学 方法 的 学 生平 均 成 绩 没 有 显著 差异 
A, 接受 不 同 教学 方法 的 学 生平 均 成 绩 不 完全 相同 
为 采用 Kruskal-Wallis 检验 对 假设 作出 判定 ,将 宸 6 一 4 中 的 
所 有 学 生成 绩 排 序 ,最低 分 秩 评 为 ] ,最 高 分 秩 评 为 50。 由 于 50 名 
学 生 中 有 不 少 是 同 分 ,采用 相应 秩 的 简单 算 术 平 均 数 作 为 同 分 的 


平均 秩 , 得 到 天 6 一 5。 用 表 中 数据 , 按 (6. 2) 式 计 算得 到 
. l2 (649.58 , 318.5? , 307 
' 7 5660 Fi ^30 un + SEC 
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— 158. 2626 — 153 


一 5. 2626 
表 6 一 5 学 生 考 斌 成绩 的 薄 级 
I I I 
5 22 6.5 22 32.5 
6.5 26.5 L5 24.5 37. 5 
9 40 11.5 44.5 18. 5 
32.5 48.5 19 37. 5 19 
41-5 44.5 24.5 32. 5 14. 5 
1.5 4 325 14. 5 26.5 
3 5 375 22 37. 5 
1i.5 32.5 44.5 44.5 32.5 
14.5 29 48.5 48.5 17 
19 145 9 28 41-5 
-合计 (Ri 649. 5 318. 5 307 


附 表 1 cB.dí—-&—1—2,H —5.2626 d UMS HR P E 0.05 
550. 10 之 间 , 车 显著 性 水 平 a = 0.05, 则 数据 不 能 拒绝 五 。; 而 显著 
EKF a = 0.10, 则 数据 拒绝 豆 ,。 由 于 学 生成 绩 中 同 分 较 多 ,因而 
应 采用 校正 的 互 .计算 同 分 的 观察 值 数目 , 即 # 和 ww, 计算 过 程 列 


FR 6 一 6 中。 由 于 Xu! 一 到 一 601 一 43 一 558, 所 以 校正 因子 为 
1 Lu? — Lu 558 


Taro + rr —1) ^9? 9955 


H = 9.9955 > 2864 


XX — 258 RR 5 TE TE BU BAI FABRE BS KE a= 0. 05, dí 
—k—1—2,H, SANS WAY X = 5.99.0 = 5. 2864 « X 
= 5. 99, 数 据 在 5% 的 显著 性 水 平 上 不 能 拒绝 HELL RAST 
教学 方法 的 学 生平 均 成 绩 没 有 最 落差 异 。 

102 


E 6-6 同 分 的 观察 得 数 是 计算 


同 分 的 观察 值 u u? 
48 2 3 
56 2 3 
62 3 27 
64 2 8 
69 4 84 
72 3 27 
73 3 27 
78 2 8 
79 2 8 
84 6 216 
86 4 64 
90 2 8” 
82 4 64 
58 4 64 

合计 43 601 


36.2 到 个 样本 的 如 检验 


两 个 独立 样本 的 尖 检 验 可 以 直接 推广 到 站 个 独立 样本 ,用 来 
愉 验 个 样本 之 间 差 异 的 显著 性 ， 


一 ,基本 方法 


个 独立 样本 Xe 检验 与 两 个 独立 样本 的 基本 方法 类 似 。 零 假 
设 是 处 个 样本 来 自 同 一 总 体 ,或 来 自 一 些 相 同 的 总 体 ,样本 可 以 是 
k 个 频数 或 下 个 比例 ,每 一 样本 都 可 以 分 成 > 组 ,因此 数据 可 以 排 
成 一 个 Xr 的 表 。 若 以 Sy 表示 第 i 行 第 j 列 的 实际 频数 或 比例 ， 
ey 表示 与 其 相应 的 理论 频数 或 比例 , 那么 , 检验 统计 量 Q 为 
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Q= $ Esc (6. 4) 


以 f,. HEARS EAN SE ob 
An, Efim, = Ef = Sl e AA H N = m try tee + 
no fE— FEAR AY Bl i (E n G= 1,2, 40 ABA, RM e, 
可 以 由 下 式 计 算 
rey =n, Gu / N) (6. 5) 

当 H, 为 真 时 ,QQ 统计 量 的 抽样 分 布 近似 于 自由 度 业 一 Ch — 1)Cr 
一 10) 的 六 分 布 .根据 给 定 的 显著 性 水 平 4, 自 由 度 df = CR — DG 
一 D. ÆRA 1 HR. RT ELE HS EX LET BP s DEL XS ZF, Hl 
数据 在 a 冰 平 上 拒绝 HQ < Es BEE e AE DOR RETA Ho 


二 :应 用 


[556.41 收听 体育 广播 兴趣 不 同 的 人 ,参加 体育 活动 的 情 
这 是 否 也 不 相同 
1990 年 秋 的 《亚运 会 调查 ,在 全 国 范围 抽 选 12 个 省 的 2162 
A GRAI 2211 人 ,其 中 49 人 未 回答 ) , 按 收听 体育 广播 的 兴趣 程 
度 分 为 :很 不 喜欢 ,不 喜欢 、 无 所 谓 、 喜 欢 . 非 常 喜 欢 五 类 ,名 类 人 员 
参加 体育 活动 情况 如 表 6 一 7。 
表 6 一 7 ” 音 类 人 员 参 加 体育 活动 情况 的 人 数 


ETER FER AMB Bee IFEX sit 


ABM 15 96 644 290 57 1102 
EE 3 15 218 204 49 489 
2h SM 4 15 105 133 32 269 
ARM 3 14 119 108 58 302 
a it 25 140 1086 715 196 2162 

AAA 


FORA ATA ORED A OY RIT DHT IP 262, ALIAS IRA DA MEAL, 1992, 

AS NE EN ESO AE 

XE RS 2162 A BÉ PLHLAE AREA, BLUE e = 5 Jor EUR EE E 
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= 141.7795 

HE MIKE e = 0.05, df= (&— D)(r— 1) =(5— 1)(4 
一 1) = 12, 4R 1 MARTY = 21.03, AA Q = 141. 7795 > 
xi = 21.03, FRU He 5% 的 水 平 上 拒绝 五 ,表明 收听 性 育 广 播 
兴趣 不 同 的 人 ,参加 体育 活动 的 情况 也 不 同 , 即 收听 体育 广播 的 兴 
DAMA BE A a 


三 点 个 比例 相等 性 检验 


若 所 研究 的 个 独立 样本 是 个 比例 ,那么 ,对 个 独立 样本 
是 否 来 日 同 一 总 体 ,或 是 否 来 自 六 个 相同 总 体 的 检验 ,实际 是 对 名 
个 比例 相等 性 的 检验 .不 个 比例 分别 记 作 P,P;,… ,PP, 则 建立 的 
假设 组 为 
Ha Pl=P,=-…—P, 
Hy, Pj(j 二 1.2.52) 中 至 少 有 两 个 不 等 
为 了 对 假设 作出 判定 ,所 需要 的 数据 是 定 类 尺度 测量 的 .个 
样本 的 数据 个 数 分 别 为 mm ,zz 那么 第 7 个 样本 观察 值 数目 记 
TF n, Cj = 1,2, 40 .上 个 样本 的 实际 频数 分 别 记 作 fief Sas 
则 下 个 样本 的 平均 比例 互 为 
P = Sfi En, (8. 6) 
HI C6. 6) 式 可 以 得 到 第 7 个 样本 的 期 望 频数 为 ”五 . 若 吾 。 为 真 , 那 
么 实际 频数 J; 与 相应 的 期 望 频数 n, P. 应 该 相等 .所 以 实际 频数 S, 
-与 期 望 频数 1 P 的 偏差 可 以 作为 度量 个 比例 是 否 相等 的 一 个 指 
标 , 为 检验 个 比例 是 否 相等 定义 的 统计 量 为 @, 其 计算 公式 为 


_ š Cf, ~ a, P) 
= Zapa- P) (6. 7) 
(6. 7) 式 也 可 以 写成 
Lodo A ss 
Q = 5G Pj 五 ) (6. 8) 


BOLO PB EE AMI EB HE dí = & — 189 Y! 5.083€. I 
"FX! ARE: FE BERE AH RV P f OXHELUE FUSE SHE DUE x? de d 
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的 一 般 准 则 相同 ， 

【 例 6.4] 三 个 区 域 房 屡 销 售 的 比例 是 否 有 差异 A 

某 房 地 产 公 司 准备 在 一 地 区 购买 房屋 并 出 售 ,由 于 资金 有 限 ， 
不 能 在 这 一 地 区 大 量 购买 .决策 者 准备 先 从 期 望 销售 比例 最 大 的 
区 域 开始 ,获得 利润 后 青 开 壁 别 的 区 域 . 为 检验 这 个 地 区 的 三 个 区 
域 房屋 销售 比例 是 否 有 显著 不 同 , 随 机 地 从 等 个 区 域 抽 选 容量 为 
100 的 样本 调查 .抽样 框 基 己 发 出 的 付款 通知 书 , 即 已 被 大 认购 的 
房屋 ,调查 结果 如 下 


区 域 I I i 
已 销售 数目 40 25 20 
发 通知 数目 100 100 100 


分 析 :决策 着 要 在 三 个 区 域 中 选择 首先 开始 销售 的 区 域 , 就 
.是 要 确定 兰 个 区 域 的 房屋 销售 比例 是 否 相同 ,也 就 是 检验 三 个 区 
域 已 销售 房屋 数目 占 发 通知 书 数目 的 比重 是 否 有 显著 差异 ,车 有 
差异 ,哪个 区 域 的 比例 最 高 ,应 从 哪个 区 域 开 始 ,车 三 个 区 域 的 房 
屋 销售 比例 分 别 记 作 1 ERA A 
Ha P,=P,=?P, 
Hi PPP, 不 完全 相等 
假定 这 三 个 区 域 相对 于 居住 单位 是 均匀 的 ,3 个 独立 样本 的 比例 
是 否 相等 的 检验 ,可 以 采用 六 检验 。 由 于 调查 数据 为 
f, = 40 f= 25 f; = 20 
= 100 n, = 100 n, = 100 
根据 (6,5) HA 
P = 2f/En = (40+ 25 + 20)/300 = 0. 2833 
于 是 三 个 样本 的 期 望 频数 分 别 为 
I; aP = 28. 33 
I: mP = 28.33 
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I H n,P = 28. 33 
6. 7) 式 可 以 计算 得 到 检验 统计 量 为 


q = (40 — 28. 33)” (25 — 28. 33) 
(28.33)(0. 7167) ' (28.33)(0. 7167) 
(20 — 28.33) 


T (28.333(0. 116) 

= 6. 7045 + 0. 5461 + 3. 4175 

= 10. 668] 
根据 给 定 的 显著 性 水 平 = 0.05, H ELE d£ = k — 1 = 2, 在 附 表 
I PAGO VAS RE XS = 5.99. AH Q = 10. 6681 > Xi = 
5. 99, RR RE 5% 的 显著 性 水 平 上 拒绝 KS PT RRA 
EASTER .车 以 自由 度 df =k 1— 2. kB 1 PRO = 
10. 6681 时 的 近似 概率 ,P 在 0.001 和 0.01 之 间 , 近似 的 PP 一 
0.91, 表 明 数 据 不 支持 Ho ,三 个 区 域 房 旺 的 销售 比例 显著 不 同 ,由 
于 第 I 个 区 域 的 实际 销售 比例 最 高 P. == /m4 =0.40>P, = 
0. 25 > P, = 0. 20 BE PX MAP RRR 56 SERRE ES Br ET Ra 。 
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第 七 章 ”两 个 样本 的 相关 分 析 


所 请 相 关 , 是 指 两 组 或 两 组 以 上 观察 结果 之 间 的 连带 性 或 联 
系 。 换 名 话说 ,也 就 是 各 组 观察 结果 所 芭 了 喘 的 特性 之 同 有 关系 。 如 
儿 个 亲生 兄 第 间 的 智商 与 出 生 嘎 序 有 关系 , 受 教 育 程度 与 性 别 有 
关系 等 等 .在 实际 问题 的 研究 中 ,人 人 们 常常 想 知 道 两 组 或 两 组 以 上 
的 观察 结果 是 否 有 联系 , 间 时 也 想 知 道 联系 的 程度 如 何 ,前 面 的 统 
计 检验 能 够 在 一 定 的 显著 性 水 平 上 ,确定 各 组 观察 值 的 关系 是 否 
好 在 :本 章 开 始 及 以 后 两 章 , 将 介绍 如 何 洲 定 各 组 观察 值 关系 的 强 
度 。 本 章 介绍 两 个 样本 相关 的 测定 方法 .除了 相关 程度 测定 方法 
外 , 还 将 介绍 判定 总 体 是 理 存 在 真实 相关 关系 的 相关 系数 显著 性 
检验 。 


371 等 级 相关 


等 级 相关 CRank Correlation) 也 称 作 级 序 相关 ,用 干 两 个 至 
少 是 定 序 尺 度 测量 的 样本 间 相 关 程度 的 测定 ， 


一 ,基本 方法 


两 个 样本 区 ,其 观察 数据 可 以 配对 为 (zi Gn yate 
A HE s ann an, 排序 后 评 秩 ,其 秩 记 作 局 ,与 x, 相对 应 的 
EAU = 1.2; yn) ;同样 ;yyy yy 排序 后 评 秩 , 秩 记 作 下 ， 
与 y AMM RA VG = 1,2, 00. RBBB m ER, 
VO Or Vd, 可 能 每 一 对 完全 相等 ,也 可 能 不 等 ,由 
于 每 一 样本 都 是 x 个 数据 评 秩 ,因此 Ur; 与 V; 的 取 值 都 是 从 1 到 nn。 
区 .了 的 秩 可 能 完全 一 致 , 即 对 于 所 有 的 i 来 说 ,有 U; = Vis 表 7 一 1 
RE BO PARA Y 的 秩 可 能 完全 相反 , 表 7 一 2 是 完全 
相反 的 评 秩 结果 。 如 果 卫 .完全 相关 ,应 该 对 于 所 有 的 i 有 U; = 

VOR U, — V, = 0. 因此 ,U; 与 VY, 之 差 可 以 用 来 度量 多 .Y 的 相关 
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程度 ,定义 
$71 完全 一 致 的 评 特 


E 7 一 2 sti dg m 


D, — U, — V, 
则 两 组 秩 完 全 相关 时 ,Di(i = 1,2, 2) FEBCSUAELD, BECK XY 
之 间 的 相关 越 不 完全 .但 由 于 D 可 正 可 负 , 直 接 用 2D, 测度 相关 ， 
会 出 现 正 负 古 ,抵消 ,而 不 能 真实 反映 已 与 V; 差 值 的 大 小 ,所 以 宣 
采用 De, p | 

3D; = SW, — Vr (7.1) 

C D 式 的 这 个 秩 差 值 平方 和 的 大 小 既 受 到 4 的 多 少 的 影响 ，- 

又 受到 两 组 秩 不 一 致 程度 的 影响 ,因此 ,采用 相对 的 测量 指标 有 利 
于 说 明基 了 的 相关 程度 。 因 为 378 的 最 大 值 反 映 式 .了 完全 不 相关 
的 情况 ,所 以 ,用 (7.1) 式 除 以 ED? 的 最 大 值 , 可 用 来 评价 美 . 了 之 


间 秩 的 差 值 是 否 与 完全 不 相关 时 接近 .车 实际 计算 的 XD? 与 X,Y 
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完全 不 相关 情况 下 的 了 (CC 一 TY 接近 ,那么 两 个 样本 的 相关 程度 
较 低 ;车 实际 计算 的 EDO XD? 最 大 值 的 比 越 小 , 则 两 个 样本 的 
相关 程度 越 高 .2D? 的 最 大 值 即 XY 间 完 全 不 相关 情况 下 的 秩 差 
值 平方 和 ,可 以 根据 表 ?一 2 PUTS ER Dix XY 完全 
不 相关 的 评 秩 结果 ,人 D? 的 最 大 值 为 | 
(a — D + [tn — 1) — 28 +--+ 62 — GQG— DE 

+ (1 — 2 

= 2[(n — 1X + (n— 3» 4] 

= n(n* — 1)/3 (7. 2) 
(C7. 20 式 的 中 括号 内 最 后 一 项 , 当 n 为 奇数 时 是 [Gx 十 0/24 1] 
一 [Le 十 1)42 一 匡 的 平方 , 即 为 2532 为 偶数 时 是 [Fa/2 — (1/2 — 
1 一 六 。 

DARIA 2) 式 得 到 
ED; 32D? 


n(n® — 13/3 nQ — 1) 0.3) 
(7.3) 式 的 取 值 从 0 到 1,38 7 一 1 数据 计算 的 (7. 3) 式 值 为 0, 表 
7 一 2 数据 计算 的 (7. 30 式 值 为 1, 即 XY 的 秩 完 全 一 致 时 ,67, 3) 
FMEA OXY 的 秩 完 全 不 一 致 时 , (7. 3) 式 的 值 为 1。 
测度 两 个 样本 等 级 相关 程度 可 以 象 参数 方法 一 样 ,定义 等 级 
相关 系数 作为 标准 。 斯 皮尔 曼 的 等 级 相关 系数 (Spearman 
coefficient of rank correlation) AE AREA ABR HE BS EE 
指标 。 其 计算 公式 为 | 
R = 1 — 2D (7.4) 
n(n? — 1) 


HR RRR ABBE Aro CE FEL ARA AAA A 
irr 不 征 积 息 相 关 的 简单 相关 系数 ,而 是 等 级 相关 的 Spearman 48 
天 系数。 由 于 (7.4) 式 与 (7. 3) 式 不 同 ,所 以 ,R 的 取 值 从 一 1 到 十 
DAR] = 1 RH X VY 完全 相关 ,R = 十 1 为 完全 正 相 关 ,R 一 一 1 
AREA R| 越 接 近 于 1, 表明 相 关 程度 越 高 ,友之 ,|R| R 
接近 于 等 ,表明 相关 程度 越 低 ,R — 0 为 完全 不 相关 。R > 0 为 正 相 
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关 ,R 过 0 为 负 相 关 。 通 常 认为 |RI > 0.8 为 相关 程度 较 高 。 
二 .应 用 


5 例 7.13 两 个 裁判 员 对 参赛 歌手 评分 的 相关 分 析 
E 7—3 是 某 次 歌手 大 赛 两 名 裁判 员 对 10 名 参赛 歌手 的 评分 
等 级 , 试 分 析 两 位 裁判 员 评 分 的 相关 程度 ，。 


家 7 -3 Vg a Fl PLE TP 5) HE 

参赛 歌手 编号 i Y D-U-—Vv D 
y] 1 5 一 4 16 
2 2 3 —1 21 

3 5 9 —4 18 

4 9 6 3 9 

5 4 8 — 4 16 

6 6 4 2 4 

7 3 2 1 1 

8 7 1 6 36 

9 10 7 3 8 


pu 
c 
ec 
me 
T 
| 
n2 


合计 112 


分 析 : 由 于 表 7 一 3 所 给 数据 为 评分 等 级 ,两 个 定 序数 据 间 的 
相关 程度 测定 可 以 采用 斯 皮尔 曼 秩 相关 系数 ,根据 (7.4) 式 计算 
得 到 


$042) 
1000 一 1) 
= J — 0.6788 
= 0. 3212 
R = 0. 3212 之 0.8, 所 以 两 个 裁判 员 对 10 名 参赛 歌手 评分 的 
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表 7- 7 经 济 水 平 与 卫生 水 平 的 秩 次 


区 其 编导 XPD Yee D-U—V pe 
dT 169 
2 2.5 7.5 一 上 1 
3 2 2 0. 5 0. 25 
7 4 4 ] 3 9 
5 5 0 0 
6 6 5 0 0 
7 7 il — 4 16 
8 8 3.5 4.5 20. 25 
9 9.5 9 0.5 0. 25 
li 9.3 10 一 0.5 0. 25 
]! 1i 16.5 — 5.5 35. 25 
12 12. 5 8 4.5 20. 25 
13 12.5 15 — 25 &. 25 
i4 14 ? 7 49 
15 15 12 3 9 
18 18 13 3 9 
17 17 18 —1 1 
18 18 16.5 1.5 2. 25 
19 19 20 一 1 1 
20 20 19 1 1 
21 21 21 0 0 
22 22 22 0 0 
23 23 24 一 1 1 
24 24 23 1 1 
合计 347. 00 
四 .的 显著 性 检验 


利用 (7. 4) 式 或 (7. 6) 式 计 算 的 R 值 ,是 抽 自 两 个 总 体 的 样本 
数据 计算 的 结果 ,从 这 一 相关 系数 的 大 小 ,可 猜测 总 体 的 秩 相 关系 
数 是 否 与 零 有 显著 差异 ,但 是 否 为 真 ,应 进行 假设 检验 .对 R (0. 
者 性 检验 正 是 为 了 回答 这 一 问题 .检验 可 以 仅 研 容 两 个 总 体 是 否 
存在 相关 ,也 可 以 分 别 研究 相关 的 方向 , 即 是 正 相关 ,还 是 负 相 关 、 
针对 研究 向 题 的 不 同 , 可 以 建立 不 同 的 慨 设 组 。 
双 和 侧 检验 
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Hi: 不 相关 
H: 存在 相关 
单 侧 检 给 
Ho 不 相关 Ho RHE 
H, Tense. A. RK 
为 对 假设 作出 判定 ,所 需 数据 至 少 是 定 序 尺 度 测量 的 。 根 据 
(7. 4) 式 或 (7. 5) 式 ,(7.6) 式 计算 出 R 值 . 当 n 所 30 时 ,在 附 表 X 
中 ,依据 有 和 RR 查找 相应 的 概率 卫 . 这 是 H JAER ASA] 
BED ERR LE P 值 小 于 显著 性 水 平 a, 则 数据 拒绝 吾 ,; 若 P 值 大 于 
显著 性 水 平 a, 风 数据 不 能 拒绝 五 . 表 7 一 8 蚌 判 定 指导 表 ,n < 10 
He 7 一 -8 及 显著 性 检验 判定 指导 表 


m 


"ETE RA E 
Ho. 负 相关 RAEE 
Ay. AA RE AA 2 (E 


int TEBAS XO 的 第 一 部 分 查找 ,10 < 30 时 在 表 的 第 二 部 分 
查找 相应 的 卫 值 .车 > 30, 则 按 (7.7) 式 计 算 多 ,2 统计 量 近 似 服 
从 正 态 分 布 ,可 在 附 表 w 中 查找 相应 的 了 值 。 
Z=R n=l (7.7) 
5 例 7.4】 对 例 7.3 作 显著 性 检验 
分 析 : 由 于 例 7. 3 中 未 指明 相关 的 方向 ,只 需 检 验 是 否 相 关 ， 
因而 建立 双 倒 备 择 : 
HQqo 不 相关 
Hy, 存在 相关 
利用 提供 的 数据 计算 的 刃 值 为 0. 8491, 每 个 样本 数据 4 为 
24, 在 附 表 XH 中 ,# = 24 时 , 双 侧 检验 |R| = 0. 608 的 概率 为 
0. 002, BIRR = 0.8491 > | R | 二 0.608, 因 此 ,概率 PP < 0. 002, 
数据 拒绝 H ,表明 经 济 水 平和 卫生 水 平 确实 存在 相关 关系 。 
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[67.51 对 例 7.2 进 行 显著 性 检验 
分 析 FERS) 7.2 中 ,结论 指出 经 济 水 平 与 卫生 水 平 存 在 正 相关 
关系 ,因此 ,检验 应 是 单 侧 备 择 : 
Br: ”不 相关 
H,: TEAS 
根据 表 7 一 5 i BAY R = 0. 8881 ,在 附 表 XE Pon = 12Hf,R 
= 0. 825 BILE; RE MRE 0. 001, BRR = 0.8881 HAREE P 
0. 001 ,数据 不 支持 五 ,表明 该 地 区 的 经 济 发 展 水 平和 卫生 水 平 存 
EEX. 


$7.2 Kendall 43H X 


Kendall 秩 相 关 即 肯 德 尔 秩 根 关 , 与 等 级 相关 一 样 ,也 是 用 于 
两 个 样本 相关 程度 的 测量 ,要 求 数据 至 少 是 定 序 尺度 的 。 它 也 是 利 
用 两 组 秩 次 测定 两 个 样本 间 相 关 程 度 的 一 种 非 参 数 统计 方法 。 


一 .基本 方法 


n VEA aro Guy 分 别 抽 选 自 XY, 
AY $B ED] LAA ARR BERE SS SEX B3 PEER EI 
然 顺序 排列 , 则 了 药 = 个 秩 也 相应 地 发 生变 动 ， AX, Y 的 秩 分 
SIDA 

X. 2 4 3 5 1 

Y: 3 4 1 5 2 
将 蕊 的 秩 接 自然 顺序 排列 后 ,和 .了 的 秩 则 为 下 面 的 形式 

X: 112 3 4 5 

Y: 2 3 1 4 5 E 
H F X BITE D iti E ERIS “DBC HEA, UL, 成 的 观察 值 每 
两 个 之 闻 都 是 一 致 对 。 考 察 了 的 秩 次 情况 ,第 一 个 秩 为 2, 第 二 个 
为 3, 因 为 2 小 于 3, 是 按 自然 顺序 增加 ,因此 ,这 是 一 个 一 致 对 .再 
考察 2 和 1, 因为 2 大 于 1, 不 是 按 自然 顺序 增加 排列 ,所 以 这 是 一 
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个 非 一 致 对 .依次 考察 下 去 , 凡 一 致 对 记 作 + 1, 非 一 致 对 记 作 一 
1 ,考察 结果 部 入 7 一 9 所 示 。 


35 7—9 Y 的 数 对 评分 

工 的 数 对 ^» 总 和 
2,3 1 8 个 十 
2.1 —1 24 一 
2.4 1 
2.5 1 
3,1 一 1 
3.4 1 
8.5 1 
1,4 1 
1,5 c i 
4.8 1 


ES II E 81 
最 六 的 评分 ,应 是 也 完 爹 按 自然 顺序 排列 的 秩 对 的 评分 , 即 每 一 数 
对 的 评分 均 为 十 1. 这 样 ,在 区 .了 的 评 秩 完全 一 致 的 情况 下 ;最 大 


可 能 的 评分 总 数 应 是 一 个 组 合 , 如 在 上 例 中 是 (2) = 10, 即 从 5 个 
里 选 2 个 的 组 合 数 。-- 般 情况 ,x 个 观察 值 对 两 两 秩 对 之 间 评 分 ,最 
大 可 能 的 总 分 为 (2)。 以 实际 的 评分 与 最 大 可 能 总 分 相 比 ,可 以 油 
定 两 组 牧 之 间 的 相关 程度 ， 

车 以 UU 表示 的 一 致 对 数目 ,表示 Y 的 非 一 致 对 数目 , 风 一 


致 对 评分 与 最 大 可 能 总 分 之 比 为 
U — 20 
(n. atm — 1) 0-8) c 


非 一 致 对 评分 与 最 大 可 能 总 分 之 比 为 
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(7.9) 


当 工 的 秩 对 完全 按 自然 顺序 排列 时 ,(7, 80 3S B (EL 1, C7. 00 RAY 
H 0; mio Y B gor e BRE SISSE C. 00 AMA 1,07. 8 
3X B5 48 2 0. ME PR A REE. MN ARRA 


一 1 到 十 1, 国 此 .Kendall 秩 相关 系数 为 
4U 


zo! (7.10) 
E 4V i 
T=1=4=D (7.10) 
车 记 S =U — V,M Kendall 秩 相 关系 数 为 
_ 28 
SGD (7.12) 


这 里 的 Kendall ARRA T E Tau 的 缩写 AED ST — 1, 
表明 两 组 秩 次 完全 正 相 关 : 人 一 一 1 表明 两 组 秩 次 间 完 全 负 相 污 。 
一 般 | 了 | > 0.8, 可 以 为 相关 程度 较 高 。 


二 ,应 用 


[ 507.61 利用 例 7.2 的 数据 资料 分 析 经 济 水 平和 卫生 水 平 
的 相关 程度 
7-10 经 济 水 平和 卫生 水 平 秩 的 排序 


街道 编号 经 济 水 平 的 秩 Dt KER AER 经 济 水 平 的 秩 卫生 水 平 的 秩 


分 析 ; 根 据 表 ?一 5 WP RARE RK ERA BAP KER 
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t 


秩 次 按 自然 顺序 排列 ,得 表 7 一 10 的 结果 ,由 表 可 以 计算 得 到 2、3、 


1.5.4.9.7.8.6.11 的 一 致 对 数目 己 
[一 10 二 9 十 9 上 +7 十 7 十 3 十 4 十 3 十 3 十 1 
一 56 
根据 47, 10) 式 计 算 有 
T= anir- p ! 
= 0. 6970 


由 表 ?一 10 可 以 计算 出 韭 一 致 对 的 数 自 Y 为 
一 1 十 I 十 1I 十 3 十 1 十 1 十 1 十 1 
= 10 
根据 (7.11) 式 ' 
0 
T—-1-— Baz 1) 
= 1 — 0. 3030 
= 0. 6970 
若 按 (7. 12) 式 计 算 , 有 


_ 2(56 — 10) 
1202 — 1) 


T = 0.6970 < 0.8: 表 明 经 济 水 平 与 五 生 水 平 相关 程度 不 够 


= 0. 6970 


高 。 

Kendall 秩 相 关系 数 也 可 以 用 于 定 距 尺度 测量 的 数据 ,数据 不 
必 评 秩 , 而 直接 比较 大 小 得 到 一 致 对 或 非 一 致 对 的 数目 。 

[1417.71 利用 例 7.2 中 表 7 一 4 的 资料 分 析 经 济 发 展 水 平 
和 卫生 水 平 的 相关 程度 

分 析 :将 表 ?一 4 中 经 济 发 展 水 平 的 评分 按 从 小 到 大 的 顺序 排 
列 , 得 到 天 7? 一 11。 由 表 计 算 卫 生 水 平 的 一 致 对 数目 

= 10 十 9 十 9 十 7 一 7 十 3 十 4 十 3 十 3 十 
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T S 
nin a nin —1)/2 —v 
[57.93 两 名 裁判 只 对 参赛 5 名 歌手 评 秩 的 相关 分 析 
两 %% 裁 判 员 对 5 名 参赛 歌手 所 评 的 等 级 如 下 
X MT 1 2.5 2.5 1. 5 4. 5 
Y Wye 2 3.5 3.5 1 5, 
AGAT XY Bey aR AX BERE SH SERI 
E 7--12 PAPA 89 TR 


(7.14) 


X mo Y (ff 分 数 总 和 
i 1 .2.5 2.3.5 m 1 3 个 加 
1,8.5 2.3.5 1 3 
1.45 2,1 —1 
1.4.5 2.5 1 
2.5,2. 3 3.54555 Ü 
2. 5,4. 5 3.5.1 —1 
2.5,4.5 3.8,5 1 
ev 244. 5 3. 5,1 — 1 
2.5,4 5 3. 5,5 1 
和 5 1,5 0 


时 , 周 秩 的 两 个 值 ,可 能 对 应 工 的 不 同 秩 . 这 样 应 将 所 有 可 能 考察 
的 请 襄 全 部 列 出 .评分 结果 如 表 T—12. B x E A X XY 
中 ,出 现 的 教 对 是 同 秩 时 ,其 分 数 均 为 0 根据 表 7 一 12 的 数据 ,ze 


= È 


| 
,| = (1/2Xu(u — 1) = 1/22 + 2) = 2,v = a 


1/2Zw(v 一 1) = 1, FA IB C. 14) 式 可 得 


Poe TB 
— 4(1/20)055— D —2 Xü/256 —1) —] 


= 0, 2357 
HIT T = 6. 2357 «0.8, 86984 8 5 名 参赛 歌手 评 秩 
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的 相关 程度 极 低 。 
对 于 Kendall 穆 相 关系 数 来 说 , 同 分 的 影响 也 不 是 很 大 。 


了 的 显著 性 检验 


”与 Spearman HABRA RR R — FE Kensal 秩 相 关系 数 了 的 显 
著 性 也 应 进行 检验 .这 .一 检验 实际 上 是 检验 两 个 总 体 的 相关 是 否 
真实 存在 ;是正 相关 让 是 负 相 关 , 从 而 说 明 以 荆 的 太 小 反映 相关 程 
度 的 高 低 是 否 可 信 。 如 果 研 究 关 心 的 是 相关 是 否 确 实 存在 ,而 不 考 
虚 由 关 的 方向 , 则 应 建立 双 侧 备 摊 , 假 设 组 为 

Ay, 不 相关 
H: 存在 相关 
车 关心 的 是 相关 的 方向 , 则 应 建立 单 侧 备 择 , 假 设 组 为 
Ay; ”不 相关 Hy: 不 相关 
五 +: 正 相关 Hi 人 负 相 关 
为 对 假设 作出 判定 ,所 需 数 据 至 少 是 定 序 尺度 测量 的 ,通过 对 
数据 求 出 一 致 对 或 非 一 致 对 数目 , 按 (7.10) 式 , (7.11) mE. 
(7.14) 式 计 算出 Kendall RMB AMT, 
T BREDENE XW pM n< 10 时 ,只 要 根据 s. 
T 的 值 , 可 以 在 表 的 第 一 部 分 查找 到 H JAHT 为 某 一 值 的 概 
率 Pil10<z 宏 30 峙 ,在 表 的 第 二 部 分 查找 相应 的 概率 疡 . 表 ? 一 13 
是 判定 指导 表 . 若 I 30, 507.150 EZ. 
家 7 一 13 T Ed dE UE ME dE ERE 


SE PH (REE XI) 
Has 正 相关 THERE 
) Ho. 负 相 关 T Byz Ro 
Hu 存在 相关 的 较 小 概率 的 2 从 
3T /nGr— 1) S 


Z= 一 一 -- 一 -一 ”~ _ 。 

v 2C2n + 5) vnin — 1)0(2n + 5/18 0-19) 
EF Zak ASA eT EAE 中 查找 相应 的 概率 。 
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【 例 7.8] 双胞胎 管 力 的 相关 分 析 
某 研究 所 对 10 对 双胞胎 儿童 的 智力 进行 调查 , 结果 如 表 
7—14, 


He ?一 14 儿童 智力 测试 得 分 
双胞胎 编导 FEEL CAD fo th # JLECY) 
1 9.60 7. 8 
2 16. 6 18.3 
3 16.3 20.1 
4 11.3 7.1 
5 18.2 13.0 
6 7. I 4.8 
7 7-8 E.9 
3 1.0 7.4 
号 11.2 10.6 
10 1.3 1.5 


8 7 一 15 ALBA Mik Bt FR 


X Y Xm E Y 9% n D? 
1.3 1-5 1 1 o 0 
4.0 7.4 2 4 — 2 4 
7.1 4.8 3 2 1 1 
7.8 8.9 4 6 — 2 4 
9.0 7. 8 5 5 0 a 
11.2 10. 0 6 - 4 — i 
11.3 7.1 7 3 4 16 
18.2 20.1 8.5 10 — 1.5 g. 25 
18.2 13. 0 8.5 & 9.5 9. 25 
16. 6 19.3 10 9 1 1 


分 析 : 稼 力 淖 试 得 分 是 定 距 尺度 测量 的 数据 ,可 以 转换 为 定 

序 玉 度 . 知 将 先 出 生 儿 童 的 得 分 记 作 头 , 后 出 生 儿 童 得 分 记 作 了 了， 
则 将 表 7 一 14 的 得 分 评 牧 ,得 到 表 ?一 15. 利 用 这 些 数据 分 别 计 算 
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-一 -一 mmm ew rr eee — 


Spearman H+H BH R Al Kendall BAILAR T, 
4% 7— 15 可 以 得 到 


XD: 
R= 1~ GD 
24 6(29. 5) 
10005 — 1) 
= 0.8212 


EF X PAR MOT. 6) 式 计算 ,得 到 
10010! — 1) — 6(29.5) — 1/2(3* — 2) 
JÁ1000 — 1) — @— 2 1000 — 1) — 90 
= 0, 8207 . 
4% ?一 15 可 以 计算 得 到 YY fei Oa B 
=9 二 6 十 7 十 4 十 4 十 3 十 3 十 0 十 1 二 37 
非 一 致 对 数 日 
V O20r2r1ititor1lt0oto0—7 
Kendall 秩 相 关系 数 荆 为 


_2U VW) 207-7) 
nia — 1) 1000 一 1 


= 0. 6667 
由 于 有 同 分 , 按 (7 214) 式 计 算得 到 
(37 — 7) 
UDI Ha i /(G/2)10010 — 1) 
== 0. 6742 
对 丸和 了 的 显著 性 进行 检验 ,建立 假设 组 
Hy, 不 相关 
H: 正 相 关 


在 附 表 XO P,a = 10,R = 0. 8212 BR = 0. 8207 相应 的 概 
P< 0.003; EH KN yn = 10,7 = 0.6667 BET = 0. 6742 
相应 的 概率 在 0. 002 F 0. 005 之 间 。 这 都 表明 数据 不 支持 HH, AA 
是 说 双 胞 验 儿童 的 智力 之 间 存 在 着 正 相 关 。 按 Spearman 秩 相关 系 


数 看 ,双胞胎 儿童 的 智力 之 间 相 关 程 度 较 高 .但 按 Kensall 秩 相 关 
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反 映 两 个 样本 间 存 在 真正 的 或 直接 的 关系 ,这 种 相关 性 是 因为 两 
个 样本 都 和 第 三 个 样本 有 关系 而 产生 .这 个 问题 在 参数 统计 中 是 
通过 偏 相关 解决 的 ,在 非 参 统计 中 也 可 以 用 偏 相关 方法 处 理 。 本 节 
介绍 的 是 Kendall 偏 秩 相关 系数 了。- 


一 .基本 方法 


AX Y 与 第 三 个 样本 Z 有关, 也 就 是 说 由 于 2Z 的 变化 对 六 、Y 
之 间 的 关系 有 影响 ,那么 ,考察 去 掉 Z 的 影响 ,仅仅 研究 天 了 之 疝 
的 相关 , 头 是 和 偏 相 关 。 在 统计 上 ,全 相关 就 是 在 第 三 个 样本 Z 保持 
恒定 情况 下 ,XX、Y 之 间 的 相关 。 

A AZTERX Y Z ,每 个 样本 均 有 #4 个 数据 , 且 都 至 少 是 
在 定 序 尺度 上 测量 ,那么 根据 Kendall 秩 相关 系数 ,T,, 表 示 芒 与 Y 
之 闻 的 秩 相关 程 度 ,T。 表示 XZ EAT, 则 表示 YY 
H Z 间 的 秩 相关 程度 ,Kendall (RHR 7... 为 


T — A Ty TA Tp (7.16) 


NATA) 

Tuw* 是 2 不 变 时 ,和 和 Y 之 间 的 相关 系数 ,有 时 也 写作 =。。, 这 里 下 
仍 是 Tau 的 缩写 .T.,,, 的 取 值 范 团 也 是 从 一 1 到 十 1。 但 它 的 抽样 
分 布 至 今 未 知 。 因 而 无 法 对 其 进行 显著 性 检验 ， 


` 二、 应 用 


17.9) 收入 和 继续 受 教 育 程度 的 相关 分 析 

普遍 认为 在 取得 学 十 学 位 以 后 ,在 工作 中 继续 研究 生 课 程 的 
学 习 很 重要 ,也 就 是 说 在 职 继续 学 习 比 单纯 地 学 院 式 学 习 更 有 意 
X. 调查 了 7 个 人 的 年 龄 , 花 在 继续 学 习 上 的 时 间 以 及 月 收入 , 结 
果 如 表 7-16. 
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Æ 7-16 TES. IBI SIE Ur A. 
ARRE FRCS) HERES ARABE AM HACE) 


3 5 Uo +2 & a 
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分 析 : 对 于 要 分 析 研 究 的 收入 与 继续 学 习 的 关系 ,在 调查 中 
增加 了 年 龄 ,这 可 以 看 作 是 第 三 个 样本 .分析 收入 与 继续 学 习 的 关 
系 , 可 以 利用 表 7 一 16 的 资料 计算 相关 系数 。 昌 然 表 中 数据 均 为 定 
比 尺 度 测 量 ,得 样本 数目 较 少 ,不 符合 参数 统计 中 计算 积 矩 相关 系 
数 的 要 求 ,上 且 对 总 体 不 作 任 何 假设 , 故 应 采用 非 参 数 统计 方法 。 运 
用 Kendall 牧 相关 系数 是 最 合适 的 .定义 继续 学 习 的 时 间 为 禄 ,月 
收入 为 了 ,年 龄 则 为 Z。 那 么 将 下 按 共 小 到 大 的 顺序 排列 后 ,了 也 可 
以 得 到 一 个 新 的 排列 如 下 

X: 0 6 15 18 24 30 45 
Y. 2-0 1.5 2.4 2,5 3.0 2.8 2.9 


U,=5+5444+34041+0=18 


则 è Ta = T REDE —1=0.7143 


RE = 7,T = 0.7143, TE RS XN 中 查找 相应 的 概率 三 近似 于 
0.015, 对 于 显著 性 水 平 a 二 0. 05,P 值 足 够 小 ,因此 数据 拒绝 不 相 
关 的 零 假 设 , 表明 收入 与 继续 学 习 的 时 间 存 在 相关 。 BT T = 
0. 7143, 表 明 二 者 相关 程度 不 算 很 高 。 

但 考 虞 到 收入 可 能 受到 年 龄 的 影响 ,继续 学 习 的 时 间 记 会 受 
到 年 龄 的 影响 ,因而 应 排除 年 龄 因素 的 影响 ,计算 偏 相关 系数 。 对 
于 Kendall 秩 相 关系 数 来 说 ,最 易 推广 的 偏 相关 系数 就 是 偏 秩 相 
关系 数 工 ,y..。 恨 据 (7.16) 式 的 计算 公式 , 需 分 别 计 算 T To 
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4G X HORNE EB Z 的 排列 如 下 ; 
X; 0 6 15 18 14 30 45 
Z: 35 830 36 40 41 45 48 
Us 二 5 十 5 十 4 十 3 十 2 十 1 十 0== 20 
T, = ¿E — 1 = 0.9048 
将 了 依次 排序 ,得 到 Z 的 排列 为 
Y. 1.5 2.0 2.4 2.0 2.8 2.9 3. 0 


Zi 30 35 36 40 45 48 4l 


U, = 一 6 十 5 十 4 十 3 十 1 十 0 十 0 一 19 
T, = 109 


5; — — 1=0.8095 
707 — i} 
将 上 述 结 果 代 入 (7. 160 式 , 得 到 
T. 0.7143 — (0. 9048)(0. 8095) 
UU" — 4i-— 0, 9048? Y1 — 0. 8095? 
— — 0. 0724 l 


Payo E Tay EPR T o DOE AA E E 
无 法 作出 存在 相关 的 结论 .但 它 与 了 。 共同 使 用 ,可 以 说 明 , 收 入 
与 继续 学 习 的 时 间 ,在 年 龄 因素 的 影响 下 存在 一 定 的 相关 。 除 了 年 
REPA a ZL PRAT ARR 
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第 八 章 个 样本 的 相关 分 析 


前 面 -- 音 研究 的 是 个 对 象 或 个 体 的 两 组 秩 之 间 相 关 的 度 
量 , 在 实际 问题 中 ,往往 还 涉及 ?个 对 象 或 个 体 的 见 组 秩 评定 之 间 
的 相关 .对 于 至 少 是 定 序 尺度 测量 的 大 个 配对 样本 的 数据 ,或 站 次 
试验 得 到 的 数据 ,其 秩 评定 间 的 相关 ,可 以 采用 有 endail 秩 评 定 协 
和 系数 度量 。 本 章 主 要 介绍 两 种 Kendall 秩 评定 协和 系数 :完全 秩 
评定 协和 系数 和 不 完全 秩 评定 协和 素数 。 


$8.1 完全 秩 评 定 的 Kendall 协和 系数 


Te FEE BY Kendall 协和 系数 {Kendal] Coefficient of 
Concordance for Complete Rankings) HP & RY = [lH H2C 42 HF 
HIME . BY Ae Z8 EK [RIDERE HE B9 M Sg . 


— BRAG 


A BZ n BEB 个 对 
RRMA, BT USM TA PR TE EP RR A 
即 等 级 和 为 
1+2+3 +e t n= 20 + 13/2 
MRA k AE, BAX k RR BK AE enn + 15/2. 

例如 3 个 消费 者 分 别 给 6 种 牌号 电 冰 箱 的 成 量 评 等 级 ,结果 
MA 8 一 1。 表 中 最 后 一 行 R, 是 每 一 种 牌号 电 冰 箱 的 秩 和 ,总 的 秩 


和 为 tr 人 十 1)/2 一 3(6)(6 十 1)72 = 63 = i R,。 这 也 就 是 最 大 


可 能 的 秩 次 和 ,这 时 ;对 于 每 一 个 观察 对 象 或 个 体 来 说 ,平均 的 秩 
次 和 应 为 | 
Lenin + 102 /2]/n 
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AGA KAB WEC KED HE RAF 


HI ka + 19/2. RG — 1,2,- 表示 每 一 观察 对 象 或 个 
体 的 实际 秩 和 ,那么 ,只 5 ka + 1)/2 越 接近 ,表明 对 第 ; 个 观察 
对 繁 或 个 体 的 秩 评 定 赴 接近 平均 秩 ; 二 者 相差 越 远 ,远离 平均 秩 。 
由 于 Ri 与 (Cn 十 12/2 的 差 值 可 正 可 负 , 因 此 ,在 分 析 时 应 采用 差 
值 的 平方 和 。 定 义 差 值 的 平方 和 为 8, 即 

S 一 Ej ER, — kin + 19/2} (8.1) 


dER 组 秩 评定 完全 一 致 时 ， 各 个 观察 对 和 象 或 个 体 的 秩 和 与 平均 秩 
利 的 离 差 平方 和 ,是 最 大 可 能 的 离 差 平方 和 ,由 于 组 秩 评定 完全 
一 致 时 ,各 观察 对 每 或 个 体 的 秩 和 分 别 为 ,2k,… ,nk, 如 表 8 一 1， 
如 有 果 3 位 消费 者 对 6 种 牌号 电 冰 箱 的 质量 看 法 一 致 ,那么 他 们 会 
给 出 相同 的 秩 。 这 时 ,被 认为 质量 最 好 的 电 冰 箱 将 得 到 3 个 秩 1, 它 
HRA R 二 1 十 1 十 1 一 3 二 *, 被 认为 质量 第 二 的 , 秩 和 RR 二 2 
十 2 十 2 三 6 = 关 , 最 差 的 电 冰 箱 秩 和 将 是 R= 6 十 6 十 6 二 18 
三 nk. 也 就 是 说 , 当 习 组 秩 评定 之 间 完 全 一 致 的 时 候 ,R, BE, 
2ks ,nk。 因 此 ,最 大 可 能 的 离 差 平方 和 为 

EIE, — a+ 10/27 = k XU 一 (n+ 19/2} 
= Pa(n? — 1)/12 (8. 2) 

3k fs 18 257 77 Al RR UT RE NATAM EC E LE 
BR E 28 REE AY — REPE, a (8. 1) EL CS. 2) AB 
到 Kendall 完全 秩 评 定 协和 系数 W. 


T nr — 1) 
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— 12 LR, 7 ¿04 se) E 二 a (8. 3) 
W 的 取信 在 0 到 1 之 间 . 着 W = 0 RA RS IET W 
一 1, 表明 站 组 秩 之 间 完 全 相关 BE LATA 2 时 ,上 组 秩 
评定 不 可 能 完全 不 一 致 ,也 就 是 说 ,只 有 当中 = 2 寺 , 秩 评定 一 致 
和 非 一 至 是 对 称 模 反 的 ,而 > 2, 对 称 性 不 再 存在 ,因此 ,W 取 值 
An BY AE A fita 

为 方便 实际 计算 (8. 3) 式 还 可 以 写成 下 面 的 形式 
12 X Ri — SEn(n + 1) 

— A nO — 1) 


W = 


(8. 4) 
二 、 应 用 


Cl 8.1) 和 裁判 组 整体 评分 效果 的 相关 分 析 

在 某 次 业余 歌手 大 赛 上 ,6 名 裁判 员 组 成 的 裁判 组 ,对 10 名 参 
赛 歌手 的 评分 等 级 如 表 8 一 2。 
表 8 一 2 裁判 员 对 歌手 评定 的 等 级 

歌手 编号 | BARA RARAS WAAC RHAD BARE RAAF 


| 一 


2 2 i 7 5 8 d 
3 5 d 6 2 6 8 
4 9 7 5 4 10 6 
5 4 5 3 6 5 8 
6 6 6 d 7 7 2 
7 3 2 3 10 2 4 
5 7 10 10 3 4 1 
9 10 8 à 9 5 了 


Fe 
e 


分 析 : 裁 判 组 由 6 名 裁判 组 成 ,要 评价 6 名 裁判 整体 评分 效 
采 , 实 际 上 是 评价 裁判 组 整体 评分 的 一 致 程度 。 由 于 这 是 § 个 配对 
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出 现 同 分 时 ;(8.2) 式 就 变 成 
Anin? — 1) — AC 一 2t) 


12 
APH: SE Te] ASA RO RE, (8. 3) 式 和 (8.4) 式 的 分 母 就 
应 该 是 
En(n'-]) — b(EP-Xt) (8. 5) 
经 过 间 分 校正 后 的 Kendall 完全 秩 评 定 协和 系数 厂 为 
12 X Ri — SE'n(n + 1) 
W = TGF 1) AG ( 6) 
同 分 会 使 (8.4) 式 计算 的 厂 值 偏 低 , 当 间 分 观察 值 的 数目 所 
占 比 例 较 小 时 ,这 种 影响 能 够 被 忽 路 , 仍 用 (8. 4) 式 计算 W 
[Hl 分 观察 值 的 数 自 较 儿 ,所 占 比重 较 大 时 ,这 种 影响 不 应 被 忽略 ， 
应 采用 (3. 6) RHAW, 
【 例 8.21 裁判 组 整体 评分 效果 的 相关 分 析 
某 次 业余 歌手 大 赛 ,6 名 裁判 员 对 10 名 参赛 歌手 成 绩 评分 后 ， 
转换 为 秩 , 如 表 8 一 4。 
E 8—4 SLI TRE RR 
KES | 裁判 员 4 REHAB RARO RAAD RARE RAAF 


fi 


2 2.5 3 4 2 8 1.5 
3 5.5 7.5 25 4.5 5 7. 5 
4 4 7.5 2.5 3-5 19 9.5 
5 7 b 8 9 5 3.6 
6 B 2 8.5 6 7 & 
T 1 10 8.5 8 2 9. 5 
& B 3 8 J 4 3.5 
5 2.5 4 8 10 9 5 
10 10 6 10 了 3 7.5 


4r dr. 这 一 问题 与 例 8. 1 38 4H, HR SE RPE W 
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Kendall 协和 系数 度量 裁判 组 整体 评分 效果 的 一 致 性 .由 于 有 较 多 
的 同 分 ,因而 必须 进行 校正 . 表 8 一 5 是 RR, 的 计算 表 , 在 裁判 员 A4 纵 
的 10 名 歌手 详 分 中 ,有 2 个 2.5 秩 ,2 个 5.5 秩 ,因而 在 裁判 员 有 的 
评 秩 中 B23-3t = (3 十 23) 一 (2 十 2); 在 裁判 员 上 5 所 评定 的 秩 中 ， 
同 分 的 只 有 ?7.5, 裁 判 员 c 有 2 个 2.5,2 个 8.5,3 个 5, 以 此 类 推 ,并 
计算 Se 一 如 .计算 过 程 如 表 8 一 6， | 


3 8 一 5 R, 的 计算 表 
歌手 编导 R, Ri 
i 11 121 
2 21 441 
3 30. 5 930. 25 
4 37 1369 
5 35. 5 1260. 25 
6 37. 5 1406. 25 
7 39 1521 
8 36. 5 1332. 25 
9 36.5 1332. 25 
10 43. 5 1892.25 
合计 328 11605.5 
表 8 一 6 同 分 校正 因子 计算 表 
z n 
A 24-2 23 + 28 
B 3 23 
C 2+2+3 234 294 33 
D 2 23 
F 2+2+2+2 25 + 25 25 + 2? 
l 合计 23 107 


Hea = 10, = 6 URE 85, 8 一 6 的 计算 结果 代入 (8. 6) 式 ， 
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得 到 校正 后 的 WW 为 
| 12(11605. 5) — 3(82%10(10 + 1)? 
— €65)10(0? — 1) — 6007 — 23) 
— 0. 2444 
HARE BUE ,直接 运用 (8. 4) 式 计 算 ,得 到 
w . 12011605. 5) — 3C6510(0 + 1)? 
10(67) 10? — 1) 
= 0. 2409 
计算 结果 表明 ,6 名 裁判 员 的 裁判 组 对 参赛 歌手 的 看 法 一 臻 
FER TR. ROE SE AS W ART RES B3 W i. DUE 24 [8] 4p I LAE 


” 秆 数目 比例 较 大 时 ,一 定 要 进行 校正 。 


W 的 显著 性 检验 


对 W 显著 性 的 检验 ,是 为 了 对 总 体 间 是否 存 在 真实 的 相关 基 
系 作出 判定 。 由 于 是 去 个 样本 ,只 能 建立 双 侧 备 择 ,假设 组 为 
Hı: AWR 
Ho: 存在 相关 
: 为 了 对 假设 作出 判定 ,需要 容量 均 为 ”的 天 个 样本 数据 至 少 是 在 
定 序 尺 度 上 测量 的 ,每 一 观察 值 都 能 有 相应 的 秩 。 
检验 统计 量 因 样本 的 大 小 而 有 所 不 同 。 当 样本 的 观察 值 n 较 
小 时 ,采用 的 检验 统计 量 为 5， 


S= X R? 一 S&'n(n — 19° (8. 7) 
当 样 本 观察 值 数目 = RAN, RA O Rite. 
Q= kn — DW (8. 8) 
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检验 统计 量 S 在 H, AAAS A RIE XV n= 
Sk SBA, S A AE PAW Rn = ALESCATIESS (B 
出 现 的 概率 了 秆 , 均 可 以 在 附 表 XV OP ERR OAR ,利用 (8.8) 
式 或 (8.9) 式 计算 QQ 统计 量 .Q 统 计量 近似 为 自由 度 手 二 n 一 1 的 
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入 分 布 , 在 附 表 1 中 可 以 查找 H, AAA O 为 其 值 的 概率 .无 论 
是 在 附 表 XV 或 附 表 I 中 查找 的 概率 卫 值 , 若 小 于 或 等 于 给 定 的 
显著 性 水 平 <, 则 数据 拒绝 万 ,开明 总 体 存 在 相关 。 
(518.31. 对 例 8.2 的 丈 值 进行 显著 性 检验 
分 析 :因为 在 这 个 问题 中 ,nr == 10, = 6, 所 以 应 利用 三 值 计 
HATE @, 根 据 (8.8) 式 计 算得 到 
Q = ki — 1)W 
= 6 (10 — 1) (0. 2444) 
= 13.1976 
根据 自由 度 df 二 n 一 1 二 9， 显著 性 水 平和 二 9.05, 在 附 表 I PE 
找 得 到 y: = 18. 92, h F 
Q = 13.1976 « x2 = 16.92 
所 以 数据 在 5% 的 水 平 上 不 能 拒绝 五 ,表明 6 名 裁判 员 所 作 的 秩 
评定 彼此 不 相关 , 若 在 附 表 1 PARARE di =n -— 1 = 9, 在 
H, 为 真 时 ,QQ@ = 13. 1976, 出 现 的 概率 PP 在 0.10 到 0.20 之 间 , 这 一 
慨 率 显然 大 于 显著 性 水 平 a = 0,05, 因 此 可 以 作出 结论 ;在 五 ,为 
RENEW 值 出现 的 概率 较 大 ,不 能 拒绝 万 ,, 也 就 是 说 5 名 裁 若 员 对 
BRKT TEN RIE RII. 


$8.2 不 完全 秩 评定 约 Kendall 协和 系数 


在 实际 问题 中 ,往往 会 过 到 这 样 的 情况 ,加 在 参赛 的 10 名 歌 
手中 ,只 评 出 6 名 排 等 级 ;在 对 几 种 消费 品质 量 评 级 时 ,消费 者 只 
评 出 其 中 最 满意 的 3 种 等 等 。 这 时 ,不 是 所 有 配对 样本 的 每 个 观察 
值 都 被 分 配 等 级 ,也 就 是 秩 的 评定 不 完全 .研究 这 种 情况 下 ,裁判 
员 评 分 效果 的 一 致 程度 ,消费 者 对 产品 质量 满意 的 -- 致 程度 等 ， 
不 能 采用 上 节 所 述 的 Kendall 协和 系数 ， 而 应 采用 本 节 介 绍 的 不 
元 全 秩 评 定 的 Kendall 协和 系数 。 


一 ,基本 方法 


替 被 分 析 的 数据 是 在 个 组 , 即 上 个 样本 ,每 组 均 含 有 个 观察 
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完全 秩 评定 的 情况 ,可 以 考虑 采用 不 完全 秩 评 定 的 Kendall 协和 
系 效 .但 在 粳 用 时 ,通常 有 这 样 的 限制 , 即 对 玉 关 二 以 及 4 来 说 ， 
应 该 是 匹配 的 , 即 满足 (8.10) 式 。 
Anta — 1) = Emm — 1) (8. 10) 

式 中 ,4 是 配对 样本 被 比较 的 次 数 , 例 如 ,3 个 消费 者 对 3 种 牌号 的 
彩电 质量 评 等 级 , 若 3 种 牌号 的 彩电 私 一 次 被 比较 , 则 4 二 1， 
(8.1 式 是 不 完全 秩 评 定 的 Kendall 协和 系数 运用 的 一 个 假设 ， 
称 作 平衡 假设 .mm 尖 之 问 不 是 能 够 完全 任意 的 .如 对 于 4 个 观察 
对 象 的 一 个 配对 比较 ,n = 4ym = 2,%4 A= 1 HH, ERR — 642 
一 2, 则 “一 12, 也 就 是 说 , 当 有 4 名 参赛 歌手 比赛 时 , 按 不 完全 秩 
评定 的 设计 ,从 中 评 出 2 名 给 予 等 级 ,那么 --- 次 比较 时 ,需要 6 名 
裁判 员 ,车 两 次 被 比较 , 则 需要 12 名 裁判 员 ,一 般 情 况 下 ,Xn 
的 取 值 如 表 8- 一 7。 

当 分 析 的 数据 符合 上 述 条 件 时 ,可 以 得 到 一 个 上 行 各 x 别 的 
# 在 每 一 行 中 ,只 有 m 个 秩 ,在 每 一 列 中 ,有 km/n 个 秩 。 对 于 每 
一 行 来 说 , 秩 和 为 1 十 2 十 … 十 mm 二 mim — 1)/?, 由 于 有 此 行 ， 


3X 5—7 

A È E m 
1 3 3 2 
1 6 4 2 
1 7 了 á 
I 10 5 Z 
2 4 4 3 
2 6 3 2 
2 12 4 2 


因此 ,所 有 的 秩 和 为 Em Ga + 10/2 SEF n PUE, SEES ET AY 
MA 
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&mm + 1)/2n 
车 每 列 的 实际 获 和 记 作 民 j(f = 1,2:.1) 那么 ,实际 秩 和 与 平均 
Pk 和 的 差 值 大 小 也 可 以 用 作 判 定 协调 性 程度 .由 于 实际 秩 和 与 平 
均 秩 和 之 差 可 正 可 负 , 因 而 , 仍 采 用 差 慎 平方 和 .定义 S 为 


01 _fmlm+ DY 
S= E[R, | (8.11) 
24 b ARR PPE sce BAY SS 就 是 
An — 1) 


XE ie ERI PA BAR AB PA A] A. EE 
(8. 11) 式 与 (8. 12) 式 相 比 ,可 以 用 来 度量 上 组 秩 评 定之 间 的 协调 
竹 或 一 致 性 。 这 就 是 不 完全 秩 评定 的 Kendall 协和 系数 ,也 记 作 
W .其 计算 公式 如 (8. 13) 式 和 (8. 14) 式 。 


125 
W ~ xu (8. 13) 
u — 135 È hmm + 1)/2n F (8. 14) 


jal Anin? — 1) 
Qn m =n MA = AAG 式 和 (8,14) 式 就 是 (8, 3) 式 ， 
W 值 在 0 到 1 之 人 间 。 丈 为 0, 表 明天 组 秩 评定 之 间 不 相关 ;为 
1 表明 # 组 秩 评定 之 间 完 全 相关 , 即 完 全 一 致 .由 于 上 >>2 时 , 秩 评 
定 的 一 致 和 非 一 致 不 是 对 称 的 ,因而 , 环 取 值 不 可 能 负 , 为 实际 计 


4812; 4 08. 130 式 和 (8. 14) 起 可 以 写成 (48, 15) 式 的 形式 。 
34m? (m + 1)? 


12S = 12 ER! 一 
n 
125 Ri — 32?m? Cm +1)? /n 
wW HAD (8. 15) 
二 ,应 用 


[$18.41 消费 者 对 彩电 质量 评价 的 一 致 性 分 析 
7 种 不 同 牌号 的 彩电 质量 检验 ,不 要 求 消费 者 对 每 一 种 牌号 
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对 彩电 仅 一 次 被 比较 ,因而 有 4 二 1, 需 要 的 消费 者 数 自 ;可 以 从 
(8. 10) 式 中 计算 得 到 
puo -D 
am — 1) 
iDO- Ly 
3(3 — D 
5 8 一 8 消费 者 对 彩电 质量 可 能 的 评 秩 


消费 者 编导 Ea BHR 彩电 C 彩电 也 EE BF 彩电 如 


1 * * * 


+ E * 


>» 对 -* 


2 
3 
4 + * * 
5 
é 
7 


+ = * 


时 需要 有 ?了 名 消费 者 来 评定 。 表 8 一 8 是 一 种 满足 要 求 的 设计 表 
格 , 表 中 的 * 号 表示 那 种 牌号 的 彩电 被 消费 者 评 秩 。, 由 于 mm 一 3， 
n = 7k 7, ROR PR A m = 3 个 秩 , 表 中 每 一 列 有 kx/n 
= 7030/7 = 3 个 我 ,经 过 消费 者 评 秩 ,结果 如 表 8 一 9。 

衣 3—9 消费 者 对 彩电 的 猴 评 定 结果 

消费 者 编号 A B C D E F G 
boo 2 3 
1 5 2 


分 析 ; 由 于 这 是 不 完全 的 秩 评 定 , 设 计 要 求 符 合 (8.10) 式 的 
平衡 假定 ,可 以 采用 不 完全 秩 评定 的 Kendall 协和 系数 ,分 析 消 费 
考 对 彩电 质 基 评价 的 一 致 性 。 

根据 (8 ,15) HE 

125 = 12(3* + 5* + 9? + 7? + 8? + 4? + 65 
— 80707003 + 1Y/7 
— 12(280) — 3024 
— 336 


_ 336  — _ 
W = =p"! 


AE W 的 最 大 值 , 表 明了 个 消费 者 对 彩电 质量 的 看 法 完全 一 
致 。 

在 不 完全 的 秩 评 定 中 , 同 分 也 是 可 能 出 现 的 ,因为 数据 可 以 由 
定 焉 斥 度 的 评分 转换 为 定 序 尺度 的 秩 。 但 是 , 旭 前 没有 出 较 简 单 的 
校正 (8.12) 式 的 公式 ,因此 ,计算 Kendall 协和 系数 时 ,仍旧 采用 
(8. 13) FO, (8. 14) 式 或 (8. 15) 式 。 


三 .显著 性 检验 


对 于 不 完全 秩 评定 的 Kendall 协和 系数 ,也 可 以 进行 显著 性 
检验 ,建立 的 假设 组 为 | 

Hao 不 相关 

Hi 存在 相关 

为 对 假设 作出 判定 ,需要 太 个 样本 的 数据 至 少 是 定 序 尽 度 测 
量 的 ,并 能 够 根据 (8. 11) 式 、(8.15) 式 分 别 计算 出 SW LIRE S, 
W ,按照 (8. 16) 式 .(8. 17) 式 计算 得 到 检验 统计 量 Q, 统 计量 QQ 过 
似 于 自由 度 df =n 一 1 的 六 分 布 .因此 ,在 附 表 1 中 ,可 以 查找 本 
为 真 时 , 久 为 某 值 , 即 环 为 某 值 的 概率 书 。 根 据 已 的 大 小 ,可 以 对 拒 
绝 或 不 能 拒绝 五 。 作 出 判断 。 | 
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^ Anm + 1) (8. 17) 


[48.53 利用 例 8 4 AEE da E 

分 析 YER] 8.4 A= lo = 3,n — 7,W = 1, 将 各 个 数值 代 
入 (8. 16) 式 得 到 

O = KT D112 

EHE dí =2n —1=6 HR 1 PH, ARRQ 12 出 现 的 概 
R PRAT 0-05, HA ER 0. 05 BEX = 12. 59, APRA P 
是 近似 的 值 , 因 而 , 订 以 在 显著 性 水 平 a= 0.05 上 拒绝 Hya mH, 
W 的 值 为 最 大 可 能 值 1, 拒 绝 H, 是 合乎 逻辑 的 。 


.多重 比较 


车 了 值 很 小 ,以 至 于 A, 被 拒绝 ,也 就 是 组 不 完全 的 秩 评 定 
之 闻 存 在 相关 ,那么 ,有 必要 比较 这 上 组 秩 之 间 是 否 有 重大 的 不 
[8] ,可 以 运用 多 重 比较 技术 来 研究 这 一 问题 ， 

第 7 FUGA R, 除 以 该 列 的 秩 数目 kr/n, 是 第 j 个 对 象 的 平 
均 著 ,比较 a 个 对 象 的 个 不 完全 组 的 秩 之 间 有 无 明显 不 同 , 可 以 
利用 各 个 对 象 的 平均 秩 比 较 , 也 可 以 利用 各 列 秩 和 的 差 值 比较 ,对 
于 任意 两 个 列 等 级 和 (CR,,R)1 志 i 关 j 扎 1, 它 们 的 差 值 在 1 一 a 水 
平 下 ,满足 (8. 18) 式 或 (8. 19) 式 


. P 
AR Rp zem —D (8.18) 

- — 
或 IR, — R| < z ZED (8. 19) 


表明 ”个 对 象 则 秩 评 定 设 有 重大 的 不 同 ; 而 若 IR 一 Rj;| 大 于 
(8.18) AX. 190 式 的 右 侧 ,表明 这 是 有 重大 不 同 的 数 对 。 
(8. 18) 式 .(8.19) APAI Z, an RRR ERA WV 中 ,利用 
a/n(n 一 1) 查找 。 因 为 2 是 对 应 于 2/11 一 1) 右 属 概率 的 正 态 曲 
. 143 


线 的 临界 值 点 。 若 不 大 ,在 附 表 XV 中 以 P= 二 n(n 一 0/2. 8 
性 水 平 为 a; 可 以 查找 到 相应 的 数值 ,替代 (8. 18) 3X, C8. 19) 式 中 
的 Z. | 
[E 例 8.63 对 例 8.4 的 各 组 秩 进 行 比较 

分 析 ;在 例 8. 5 中 ,由 于 已 值 不 够 大 ,拒绝 了 五 ,, 即 各 组 不 完 
全 秩 评 定 间 没有 差别 的 零 假设 被 拒绝 ,在 这 个 前 所 下 ,可 以 进行 多 
HEHE. BE 8 一 9 所 得 到 的 各 列 秩 和 可 知 ,消费 者 对 7 种 牌号 彩 
电 质 量 的 评价 最 好 的 为 4, 最 差 的 为 C, 根 据 秩 和 由 少 到 多 排列 ， 
消费 者 对 7 种 彩电 质量 满意 程度 依次 为 .A、F、B,G.D,E.C， 

取 显 著 性 水 干 «—0.10,B8 T 2—7.88P—n(a—20/2— 
21, 查 附 表 XVM ,得 到 2. 823, 代 入 (8.19) 式 ,得 到 

|R: — R;| x; 2.828 7 (0) (3 + 2/6 = 6.0984 
Tie 8 一 9 中 各 列 秩 和 两 俩 比较 差 值 ,可 知 ,最 大 差生 为 A 5 cC Bil 
Bl |3 — 9| == 6。 这 一 差 值 仍 小 于 6.0984,。 因 此 ,可 以 得 出 结论 ;在 
7 种 牌号 彩电 的 不 完全 秩 评 定 中 ,各 列 之 间 没 有 什么 重大 不 同 , 若 
EX a = 0. 30,H(8. 19) 式 得 到 
ÎR: — Rj| s 2.45 JIG F 1076 = 5. 2926 

根据 表 8—9 中 提供 的 各 列 秩 和 可 知 ,除了 4 与 C 秩 和 的 差 值 较 太 
外 ,其 它 各 列 秩 和 之 间 没 有 什么 重大 的 不 同 ,4 与 C 的 差异 ,说 明 
对 于 消费 者 来 说 ,对 彩电 4 质量 的 评价 大 大 高 于 对 彩电 C 的 评价 ， 
AA A 的 秩 次 和 低 于 CC 的 秩 次 和 较 多 。 


$8.3 Friedman 检验 和 多 重 比较 


Kendall 协和 系数 是 大 个 样本 的 秩 评 定 间 一 致 性 的 测度 ,可 用 
于 检验 组 秩 之 间 的 独立 性 有 了 时 ,研究 所 关心 的 并 不 是 组 秩 之 
间 是 否 独立 ,而 是 上 组 秩 之 间 的 联系 .例如 ,对 同一 种 疾病 ,有 几 种 
处 理 , 那 么 几 种 处 理 效 果 是 否 相 同 , 对 这 样 的 问题 进行 检验 并 作 和 多 
种 比较 ,可 以 采用 Friedman 检验 。 
Friedman 检验 亦 称 弗 里 德 曼 双 向 评 秩 方 差分 析 (Friedman's 
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Two-way analysis of variance by ranks 或 Friedman Two-way 


analysis with ranks) 它 是 在 第 五 章 中 所 介绍 的 方法 。 
一 ,基本 方法 


若 研 究 的 是 几 种 处 理 的 效果 是 和 否 有 差异 ,那么 建立 的 假设 组 
为 ， . 
Ho; gno = fe = “a 
Ay. G= E 
这 里 G = 1,2, n 是 第 j 种 好 理 的 平均 效果 , 即 平均 秩 。 为 对 
假设 作出 判定 ,所 需要 的 数据 至 少 是 在 定 序 尺度 上 测量 ,要 能 将 数 
据 排 成 x 行列 的 双向 表 , 如 下 面 所 示 ,。 表 中 RR 表示 第 1 行 第 j 列 
数据 所 应 评定 的 秩 。 对 于 每 列 来 说 , 平均 秩 和 和 应 是 [nln 十 
19/21/14 = ki 1)72。 对 五。 是 否 成 立 的 判定 ,可 以 通过 各 个 
RG — 1.2.70) 与 平均 秩 和 Cn 十 1)/2 之 闫 的 大 小 来 作出 定义 


外 RE 行 的 秩 和 C 
Ru Ra ce Ri “ee Es] nn + 12/72 
Ra Ra "T Ra; M Ra nín + 13/2 
组 : ; 07i : 
Ra Ra c Ra vr RQ| nO 19/2 
n Re c Ri e R,, nia + 1)/2 
PR FRE R, R, Ut R, — kn(n ct 19/2 
e Elo 2a +7 . 
S= ŠÍR, | (8. 20) 


S 是 实际 的 列 牧 和 与 平均 牧 和 的 离 差 平方 和 。 这 与 (8. D 式 是 相同 
的 . 它 也 可 以 写成 


s= 3 E Rj; 一 - I (B. 21) 
为 对 假设 作出 判定 ,定义 统计 基 O 为 检验 统计 量 
_ 128 
Q= kn(n + 1) 
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= 125 Rifkn(s + 1) — Bk(n 4 D (8. 22) 
gpl ， 
这 与 (8 . OME. sEHE QE migdt-a—iifxdm, 
TER e 1 p, ELE I CLA OA AA P Li HT EUR. 
PASEO IAEA adf = me dde LO AAA, 为 真 时 的 
MR xis Qm A HoE Q OA MAREA A, 


二 .应 用 


0618.71 四 种 药物 治疗 效果 是 否 有 差异 

四 种 药物 可 以 治疗 同一 种 疾病 ,为 检验 其 效果 是 否 有 显著 差 
ERT 32 名 患 该 种 病 的 病人 接受 治疗 ,每 4 人 一 组 , 共 分 8 组 。 
同一 组 的 4 名 病人 符合 配对 条 件 , 随 视 地 指定 某 人 使 用 药物 A、B、 
< :剩余 1 人 用 药物 石 。 经 过 一 个 周期 的 治疗 后 , 艰 据 病情 好 转 情 况 
评分 ,结果 如 表 8 一 10。 


表 8 一 10 病情 好 转 得 分 


分 析 ;: 评 价 8 个 配对 样本 的 差异 性 ,实际 是 检验 考察 8 组 秩 是 
否 相同 ,可 以 利用 和 样本 的 平均 秩 是 否 相同 ,完成 检验 目的 .建立 
的 假设 组 为 
Ay: — t = n = 
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H: g(j-12:3,4) 中 至 少 有 两 个 不 等 
这 是 样本 答 量 为 4 的 8 个 相关 样本 的 检验 问题 , 可 以 采用 
Friedman 检验 .将 表 8 一 10 中 的 评分 转换 为 铁 , 并 求 出 每 列 的 秩 和 
R; dx 8 一 11 Brom. 
NER CB. 22) 式 可 以 得 到 
Q = 12€(8* + 17? + 26. 5? 4- 28. 5D /4( + 1) 
— 3(8)(4 + 1) 
22410/160 — 120 
= 20. 0625 
EME 1 H, MEA «= 0.05 df =a — 1=3,H, AH 
PY ae We FP EL 2 = 7. 82, HF OQ = 20. 0652 > Yi = 7.82, FE EUER 
不 支持 Ay BY Eo BIT RRA REAR Æ dí =n — 1 
= ERE IQ = 20. 0625 RHE P <0. 001, BR P (B 
大 大 小 于 显著 性 水 乎 a = 0.05. 因 此 ,调查 结果 不 支持 Ha 


8-11 病情 好 转 程度 的 秩 

病 太 的 组 ] 药物 A 药物 B f E 药物 也 

1 1 2 3 4 p 

2 1 2.5 2.5 4 

3 1 z 4 3 

4 1 2 1 3 

5 1 2 3 1 

5 1 ag 4 . a6 

T 1 2 3 4 

8 1 2 3 4 
Sii | g 17 26. 5 28.5 

= SHR 


车 在 上 述 检验 中 P 值 较 小 ,拒绝 了 ELLE EE TR T LANAS 
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TALARA AR AE, a AE EEK 
化 果 与 其 它 的 处 理 有 明显 的 不 同 ,这 就 要 进行 多 重 比较 。 

TE k X n dr RAP RAR, ARA RU TPR AA 
HE, G m 12 0) 表示 秩 的 平均 值 . 则 只 关 是 的 一 个 估计 值 .多 
重 比 较 就 是 利用 上 之 亲 的 差异 比较 几 种 处 理 有 无 重大 不 同 的 一 
种 方法 . 它 是 借助 于 一 个 全 面 或 总 的 评价 关系 进行 比较 。 使 用 平均 
fk R,/k 与 使 用 秩 列 的 总 和 R, 是 等 价 的 ,因而 与 § 8. 2 中 一 样 , 可 
以 利用 两 个 列 秩 和 的 差 导 进行 比较 ,在 1 一 a 的 水 平 下 ,下 面 的 不 
等 式 (8.23) SF B LL RA CR; RO iA j <n AREAL, 
LAA RRA HA AMARA RR 大 于 右 侧 的 
信 , 则 表明 这 两 种 处 理 之 间 有 重大 的 不 同 。 


R- R| <z Je D (8. 23) 


(8. 23) 式 中 的 常数 2 是 正 态 曲 线 的 一 个 临界 值 点 , 它 对 应 于 
&/n(n — 1) 的 右 尾 概 率 ,借助 于 nn 和 a, 可 以 在 附 表 WN 中 查 到 相应 
Å Z È. a BUDET, ËF P = a — D/2 计算 得 到 三 ,在 附 表 
X V 中 ,查找 与 a 相应 的 值 ,这 就 是 (8. 23) 式 中 的 Z 值 。 

[5i 8. 8 了 四 种 药物 治疗 效果 之 间 有 无 重大 不 同 

AIF Bil 8. 7 的 数据 比较 四 种 药物 治疗 效果 间 有 无 重大 不 同 

分 析 : 例 8.7 中 五。 被 拒 绝 , 表 明 四 种 药物 对 治疗 同一 种 疾病 
的 效果 不 完全 相同 .但 它们 之 间 有 无 重大 差异 , 邦 两 个 之 间 最 不 相 
同 , 可 以 运用 多 重 比 较 加 以 解决 。 

由 于 # 不 大 ,因而 计算 P= 二 n(n 一 1)/2 一 6, 附 表 X V ma 
0.10,P =6,Z (Eg 2. 394.4 ACB. 232 式 得 到 i 


[R — R,| < 2. 394 pan D = 12. 3626 


计算 表 8 一 11 中 各 列 秩 和 之 差 , 可 以 得 知 ; 对 于 a 二 0.10 的 水 平 ,4 
£T RI C 2995, B 药物 各 药物 的 秩 和 之 差 均 大 于 12. 3626, 表 明 
” 尼 们 的 治疗 效果 之 间 有 重大 的 不 同 。 由 于 评 屠 是 根据 评分 由 小 到 
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教育 水 平 . 表 9-1 BpSU HH ANA AA .是 考察 教育 水 平 对 妇 
Sr EHS BE A I POPUL BRAT RR 

FURR ae By ELTEAE Hh c RE X 变量 条 件 下 ,Y 的 次 数 分 布 情况 。 
FAL I. FUER PERERA LU ie FE BA IRR BE 
A TARRE RE RHE STH BR, PAIR IRR OK 
中 的 次 数 , 称 为 条 件 次 娄 RRE TEH RET AEREA 
(ARE ARO AER 9 一 1 中 ,教育 水 平 低 的 有 200 人 ,这 是 边缘 
次 数 , 其 中 以 理想 工作 为 志愿 的 有 105 人 ,这 是 条 什 次 数 。 

291 HUS 2 行 和 2 列 , 因 此 , 称 为 2X > 列 联 表 .这 是 最 简 
单 的 列 联 表 。 当 行 . 列 不 只 为 2 时 ,一 般 称 为 > xc 列 联 表 , 其 中 
Row RR 1T ,cCColumn) ERAS, SH 1,2 0 4 = 1,2, 
0 表示 条 件 次 数 , 则 > Xec 列 联 表 如 囊 9 一 2 所 示 。 


表 9-2 r xr FBR 
AY X. ” ere X; e... Xr Er it 
Y, fu fis Ur fay et Fi fie 
Y; fn fu - Fa ar Jac Fa 
Y, fa Ju I Fis see fic fie 
Y. fa Le sar p mid fe Fr. 
& + fa fa a Fo me e n" 


~ 关 <“ 列 联 表 中 ,> 和 < 可 以 不 相等 , 即 可 以 是 3 X 3 列 联 表 ,也 可 以 
3 X IRE E f 


7 一 三 x Ly = b fa = $ fa. 
mM FESR 


Ik ARK CRS RRT ETE X ASR (EF Y RBA. 
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布 不 同 于 总 体 中 的 分 布 .这 时 ,以 自 变量 的 方向 计算 百分数 会 焉 由 
资料 ,需要 按 因 变 量 的 方向 计算 。 例 如 研究 家 庭 状 况 对 青少年 犯罪 
的 影响 。 在 某 地 区 未 犯罪 的 青少年 为 54000 人 ,犯罪 青少年 有 900 
人 .从 全 部 青少年 人 人 口中 按 1% 舞 样 ,未 犯罪 青少年 将 押 取 540 
人 ,而 犯罪 青少年 只 能 抽取 9 人 ,样本 量 较 小 ,不 易 提 供 准确 的 调 
查 结果 ,因而 需要 扩大 犯罪 青少年 的 样本 数目 , 若 从 2 人 中 抽取 1 
名 , 则 将 抽 得 450 人 ,抽样 的 结果 , 因 变 量 中 青少年 犯罪 人 数 与 末 
犯罪 青少年 人 数 在 样本 中 的 分 布 为 1 : 1.2, 即 450 名 犯罪 青少年 
与 540 名 未 犯罪 青少年 之 比 , 而 总 体 的 比例 为 1 : 60, 即 该 地 区 犯 
罪 青 少年 人 人数 与 未 犯罪 青少年 人 数 比 为 900 : 54000, HT PAI 
罪 青少年 的 样本 数目 , 因 变量 在 样本 中 的 分 布 已 不 能 代表 总 体 中 
的 分 布 .这 种 情况 下 ,应 按 因 变量 的 方向 计算 百分数 , 表 9 一 4 是 假 
定 的 次 数 分 布 , 表 9 一 5 是 按 自 变量 即 家 庭 状 况 方向 计算 的 百 分 
数 , 表 9 一 6 是 按 因 变量 方向 计算 的 百分数 .从 表 9--5 看 ,家 庭 状 
况 对 青少年 行为 的 影响 有 不 尽 会 理 之 处 ,在 和 陆 家 庭 的 774 T 
少年 中 有 272 名 犯罪 的 , 占 到 35. 14 多 ,这 个 比率 相当 高 ,显然 是 被 
专 大 的 这 是 由 于 在 抽样 时 ,扩大 了 犯罪 青少年 样本 的 数目 所 造成 
的 。 按 因 变 量 方向 计算 百分数 得 到 的 表 9 一 6 说 明 ,犯罪 青少年 来 
自 高 异 家 庭 的 比率 39. 56% 大 大 高 于 离异 家 庭 中 未 犯罪 青少年 的 
比率 7. 04 多 。 这 一 结果 证 明 ,家 庭 的 状 部 确实 对 青少年 的 行为 有 
影响 ,家 庭 的 破裂 容易 引起 青少年 的 犯罪 。 


N 9 一 4 FERRO SLE 
x E XK R 
栖 少 年 行为 一 一 一 一 一 一 一 一 € dl 
RR E HEFE 
3g $5 178 272 450 
未 犯罪 38 502 540 
a + 216 774 7 990 
0 
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表 9 一 5 家 庭 对 青少年 犯罪 行为 的 影响 
x E dk d 


FPERRA R8 8 è m Ww 
do 多 
LEE 82. 41 35.14 
EXE 17. 58 64. B5 
CHEO (216) (774) 


表 9-6 . 家 庭 对 青少年 犯罪 行为 的 影响 


青少年 行为 
家 庭 状 况 
w g FALSE 
Fa Te 
A R 39. 55 7.04 


Sod 60. 44 22.96 
(RED (150) (540) 


条 件 百 分 表 比 条 件 次 数 表 能 够 所 供 更 多 的 信息 ,因此 较为 有 
用 .但 当 r X 很 大 时 ,百分数 的 个 数 会 很 多 ,不 容易 分 析 两 个 变量 
之 间 的 关系 .因此 ,在 列 联 表 的 相关 测量 中 有 许多 更 实用 的 方法 。 


三 ,PRE 测量 法 


当 研 究 导 与 了 之 间 的 关系 ,目的 是 为 了 用 和 去 预测 了 时 ,往往 
希望 这 一 预测 的 效果 是 很 好 的 ,也 就 是 说 是 准确 的 .但 事实 上 难免 
会 出 现 误 差 。 一 般 来 说 , 两 个 变量 之 间 的 关系 僵 强 ,以 一 个 变量 预 
测 另 一 个 变量 的 误差 愈 小 ,也 就 是 减少 的 预测 误差 人 请 多 . 换 句 话 
说 , 消 厂 的 误差 有 多少 ,也 可 以 反映 变量 之 间 相 关 程 度 的 强 纶 . 因 
此 ,在 相关 测量 中 ,有 必要 引进 消减 误差 比例 的 袜 念 。 

相关 测量 法 中 有 许多 种 方法 , 扩 是 其 统计 值 具有 消减 误差 比 
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fil (Proportionate Reduction in Error) 的 意义 , 均 称 为 PRE 测量 
法 。 

在 表 9 一 1 中 ,如 果冻 未 知 , 即 不 知道 妇女 的 教育 水 平 , 仅 根据 
志愿 了 所 提供 的 信息 预测 ,那么 在 390 人 中 预测 志 三 是 “幸福 家 


庭 ”的 最 大 误差 或 说 全 部 误差 为 170 A OPEL AX A ER 


是 X 的 分 布 已 知 时 ,被 祯 测 错误 的 人 数 将 为 ;教育 水 平 高 中 实际 
志 寿 是 “理想 工作 ”而 被 预测 为 “幸福 家 庭 ” 的 65 人 ;教育 水 平 低 
中 实际 志愿 是 “理想 工作 ”被 预测 为 * 涯 福 家 庭 ” 的 95 人。 二 者 之 
和 是 X CARME IFE E E 是 全 部 误差 ,EE; EAA X 
SY 之 季 的 联系 进行 预测 时 产生 的 误差 , 则 上 E, 一 E, SERE) X [8 
预测 了 值 时 减少 的 误差 .这 个 误差 与 原来 全 部 误差 之 比 ,就 是 消减 
误差 比例 , 记 作 PRE. 其 定义 公式 为 
PRE = apu 
indi 9 一 1 的 资料 


Es E _ 170 — (65 + 95) _ 
PRE = E7005 = 0. 0588 


这 ARRA AAAS ARA O AU E 
的 边际 分 布 预测 可 以 减少 5. 88% 的 误差 ,简单 地 说 ,就 是 利用 教 
育 水 平 资料 珊 测 妇 率 志愿 可 减少 5. 88% 的 误差 。 

从 PRE 的 定义 公式 可 以 看 出 ,PRE 什 在 0 至 1 之 间 .,PRE 的 数 
什 愈 大 ,表明 天 预测 了 时 能 够 消减 的 误差 请 多 ,也 就 是 以 大 预测 了 
产生 的 误差 愈 小 . 换 句 话说 ,入 和 了 的 相关 程度 全 高 . 若 已: = 0, 以 
X HWY 不 会 产生 任何 误差 , 则 PRE 一 1,4 49 Y 完全 相关 ,。 若 E, 
= E LUX AMY HiRAS FAR X HIM Y 89835, PRE = 0; 
X EY 完全 无 关 , 表 9 一 1 提供 的 资料 ,以 教育 水 平 预测 妇女 志愿 
只 能 消减 5. 88 锡 的 误差 ,PRE 数值 太 小 ,反映 区 对 Y 的 影响 太 小 ， 
应 该 寻找 其 它 因素 来 预测 或 解释 了 。 
| 列 联 表 中 的 相关 测量 法 中 有 许多 具有 消减 误差 比例 的 意义 ， 
运用 时 应 注意 它们 对 浏 量 屋 次 的 要 求 。 | 
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89.2 HEAR RAE 


XA be A] TURBA AC. E HA 
THERE Z ED AAC ERE RABO At 
 FRAPKASUN ER, ENFADA AAA O f a 

是 最 有 效 的 。 


一 .基本 方法 


对 于 列 联 表 中 的 两 个 变量 羡 , 了 ,检验 其 是 否 独立 ,建立 的 假 
设 组 为 . 
Hoa X AY ARO) 
A: 长 与 了 不 独立 
运用 检验 作出 判定 ,需要 得 到 与 列 联 家 中 实际 次 数 相对 应 
AER X ERA ra MALY BEA rn Y 
个 数 ,那么 调查 获取 的 条 件 次 数 可 以 排 成 一 个 nox e 列 联 表 .如 表 
9 一 2。 相 对 于 每 一 个 条 件 次 数 AG = 1.2 arf 二 11,2,… sc) 的 
.理论 次 数 即 期 望 次 数 记 作 eyo H 


ri ath (9.1) 
n A r 


式 中 i= 1.2, Fy} = l," LE QI AA 
之 和 相等 ,都 等 于 总 次 数 , 即 有 | 
Z Se= 25 f,=n (9. 2) 


EH SC ARA RE GRE IUD RBH SR 
次 数 f£, 应 与 理论 预期 次 数 e, AS, EXE EDS O AER 
”次 数 与 理论 预期 次 数 e 有 差异 ,这 时 ,可 以 用 其 差 值 的 大 小 来 
度量 三 个 变量 相关 的 程度 ,相差 鳃 大 ,表明 HOS EL w] Be E 
小 ,; 即 了 与 了 无 关 的 可 能 性 印 小 。 相 反 , 差 值 傅 小 , 即 二 者 钝 接近 ， 
于 ,为 真 的 可 能 性 鳃 大 , 鲜 与 了 之 间 相 关 的 可 能 性 愈 小 ,为 避免 f, 
与 e 差 什 的 正 负 振 消 ,可 以 采用 其 秆 的 平方 和 ,这 就 是 Xx? 检验 中 
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E 7n 


的 统计 量 Q. 

(9. 3) 
统计 量 日 近似 为 自由 度 df = (rr — DG — D Ex Ati ERR 1 
中 ,可 以 根据 给 定 的 显著 性 水 平 ec, 自由 度 d£ ded, H, CST US ilg 
FAA A O Xue A RHEE Xx BY LEAL, ARTE 
HRE Q MAREA A, MBX 5 Y BUB RE 
EHK. 


二 ,应 用 
【 例 9.1】 居住 地 区 对 电 风 扇 型 式 的 需求 是 和 否 有 影响 
对 城镇 三 类 不 同 地 区 ;热带 ,温带 ,寒带 的 居民 进行 家 电 需 求 
量 的 扫 样 调查 ,结果 如 表 9 一 ?。 分 析 居 住地 区 是 否 与 电 风 扁 的 需 
求 型 式 有 关 。 
表 9 一 7 不 同 地 区 居民 对 电 凡 户型 式 的 需求 量 单位 :万 台 
E E 地 E 


ERREA 一 一 一 一 一 一 一 一 一 一 一 一 一 一 E H 
w HE di E 3k + 
E x 14 30 4 48 
落地 式 67 J 105 50 232 


* HH 111 148 78 337 


分 析 : 表 9 一 ?是 一 个 "= duc 308 2 3 列 联 表 . 研 究 两 个 变量 ， 
居住 地 区 与 电 风 南 需 求 型 式 之 间 是 否 存在 相关 , 可 以 采用 2? R 
m. . 
根据 (9.1) 式 计算 与 各 个 条 件 次 数 相 对 应 欧 理 论 预期 次 数 
ej = 1,2.,3;j = 1,2,3). 40 
hf 4801D 8 


e, = bfa H 18148) — 21.08 


pn 
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类 亿 地 依次 计算 理论 预期 次 数 , 结 果 如 表 928, 
表 9 一 8 ”不 同 地 区 对 电 风 扇 型 式 需 求 量 的 理论 次 数 REUS 
居 E 过 区 


re m a a a r r r a ŮĖĖ ie 
电 风 出 型 式 ow —— m & i 
9 x 15.81 - 21.08 11.11 48. 00 
落地 式 76. 42 101. 88 3.70 232. 00 
. SHA, 18. 77 25. 04 13. 19 57. 00 
e + 111.00 148. 00 78.00 337. 00 


将 表 9 一 ? ise 9 一 8 的 数据 代入 {9. 3) 式 计算 得 到 


《1 一 15.817 , (67 — 76. 42)? 
QUT 15. 81 + 76. 42 + 
(30 — 18.77)» (4 — 11. 11) 


18.77 十 全 十 11.11 + 


(60 一 53.70 + (14 — 13. 19)? 
53. 70 18. 19 


= 0. 2072 + 1. 1612 + 6. 7189 + 

3. 7745 + 0. 0949 + 5. 7819 + 

4. 5501 + 0. 7391 + 0.0497 

= 23.0775 

从 上 述 诗 算 可 以 看 出 RO.) RAR SETHE O EOS RET PB 
Xp rc 都 较 太 时 ,为 简化 计算 ,可 以 采用 (9.4) 式 , 它 与 (9. 3) 式 是 
一 样 的 ,但 不 用 计算 理论 次 数 ,而 是 直接 利用 列 联 表 的 实际 条 件 次 
数 和 边缘 次 数 计算 ,公式 如 下 。 


e ~ nf E 5% B 1] (9. 4) 
根据 表 9 一 7 的 数据 计算 得 到 


- AMO v:.87 9 30, 
e 337 140 + Tigan + Tien + 
4? 60 14 
十 F8048) + 7acean) | 7867 1] 
= 33711. 0684 — 1] = 23. 0508 


按 (9.3) HAIG. 4) 式 计算 的 结果 略 有 差异 ,这 是 计算 过 程 中 会 取 
小 数 造 成 。 

HEHHE dí = (— DE D —(3—-D0G—D--4, 
Sk F a = 0.05, EMR I PRR. = 9.49, HN Q = 
23. 0508 > X: = 9. 49 EHE 5% WBE LE BSE Ho. 
Bi! EHER K Sy, 3,83 E] SR ED A, A FETE TA RT . 
ii» A Fe CE Hts PECIA] FR eT E, HUBS A] A AI [8] SEK 


= ATV 值 的 相关 测量 法 


局 检 验 利 用 统计 量 己 ,可 以 检验 列 联 表 中 变量 他 是 否 存在 相 
天 ,但 无 法 测量 其 相关 的 程度 ,在 许多 的 研究 中 , 常 称 统计 量 忆 为 
X 值 ,因此 ,利用 忆 值 计算 相关 系数 ,以 度量 变量 间 相 关 程 度 的 方 
法 称 之 为 基于 六 值 的 相关 测量 法 。 列 联 表 中 ,利用 已 计 算 的 相关 
系数 主要 有 以 下 几 种 ， 

l.ej8 X AR 

多 相关 系数 即 Ph: 系数 。 它 是 由 单位 频数 的 Q 值 构 成 .其 计算 
BRA. | 

P= QIR (9. 5) 

ATQ EHO 30 ARO. 4) 式 计算 得 到 的 统计 量 Q@,n 为 列 联 家 
的 总 频数 即 总 次 数 。 


w 9 一 和 2x 2 下联 家 
X 
Y 一 一 一 一 一 一 一 一 = 
Er T; m 
yı a 5 até 
» c 7 d cd 
= ate b+a n=a+t+éieid 


? 值 对 于 2 X 2 列 联 表 ,可 以 控制 在 [一 1, + 1 %-K (8.3% 
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9 一 9 是 一 张 2 Xx 2 列 联赛 ， et a, b.c d ARERR, E EX, 
Y zu] FE EAB SER RRA FaR, BN 
a b 


ate bcd 
也 就 是 ad = be 
因此 , 差 值 ed — be 的 大 小 ,可 以 反映 变量 间 关 系 的 强 弱 .9 值 是 利 
用 这 一 差 值 来 度量 变量 间 相 关 程 度 的 系数 。 
根据 (9. D 式 , 与 表 9 一 9 中 各 实际 次 数 相 对 应 的 理论 次 数 e, 


A 
二 (a+ c) — (Ca -- eMYKc +d) 
E mM 
— (a d 6C E d) O +de d) 
DR 
(9.3) 式 可 得 
Q 一 (a — en)’ + (b 一 end + (c — en) + (d, — en)" 
£u £12 €21 £3 


o alad — bey 
— (a + £)(c 4- do(a 4- O5 V d) 
代入 (9. 5) 式 得 到 


f= 


(9.6) 


AAA (9.7) 
Ya d- 53 Cc oc d) (a FO Ed 
* ad = bc Bl ad — bc = 0 jg = 0,3XES X.Y 2 5232, BU 
不 存在 相关 。 若 2 2 Ap 9 一 10 的 形式 ,bc = 0, 则 由 (9. 7) 式 
HA PER 十 1。 这 是 和 .了 完全 相关 的 一 种 情况 ,车 2 x 2 列 联 
表 如 表 9 一 11 的 形式 ,ad = 0, 则 由 59.7) 式 计算 的 p 值 为 一 1, 这 
E XY 完全 相关 的 另 一 种 情况 。 由 于 列 联 表 中 变量 的 排列 是 任意 
的 ,因此 多 的 符号 没有 实际 意义 , 即 p= 十 1 与 9== 一 1 并 不 反映 变 
量 久 ,了 间 相 关 有 什么 实质 性 的 差别 .通常 lel — 1 时 , 称 作 完 全 相 
A HUE RI o 进行 相关 程度 的 测量 。 变 量 和 .了 完全 相关 时 , 列 联 表 
的 一 组 对 角 线 上 的 值 必 都 为 零 。 例 如 , 男 , 女 消费 者 对 某 商 品 的 质 
量 评价 ,一 类 全 部 认为 好 ,剩余 另 一 类 则 全 部 认为 差 .一 般 来 说 ， 
Ie] 小 于 1。 
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5; 9 一 10 2 x 2 列 联 家 的 一 种 形式 
X 
vw. a 0 


Na 0 d 


表 9 一 11 2 x 2 到 联 表 的 一 种 形式 
X 
zi ra 
YI 0 5 
y2 l č 0 
4r xe FRR r.c KF 2 9D rc PRECIP 
AT ER et ER SC HE BA AE. 
2. FURS AR 
列 联 相关 系数 是 Pearson 首创 的 , HICE yk 4E Rz 7k 3h 
(Pearson) 列 联 系数 或 CC 系数 , 它 是 对 9p 系数 的 改进 ,计算 公式 为 


= {_@ 
C = Q +n (9,8) 


当 列 联 表 中 两 个 变量 相互 独立 时 :C = 0。 若 两 个 变量 存在 相关 , 则 
C IR BÉ r.c 的 大 小 而 变化 .但 它 永远 小 于 1. 

“ 列 联 系数 的 显著 性 检验 .利用 样本 数据 计算 的 相关 系数 ,表明 
在 该 样本 中 两 个 变量 徊 相关 的 程度 ,但 是 否 意 球 着 该 样本 所 代 下 
的 总 体 中 也 存在 着 这 样 的 相关 ,需要 进行 显著 性 检验 ,对 列 联 系数 
C 的 显著 性 检验 ,不 是 利用 C 的 抽样 分 布 ,而 是 利用 统计 量 Q. A 
ACHACA IAEA HR TT Q (ER. OLE CAB 
3 FER MEAR IRA ARA, RET ORNS 
著 性 ,就 等 于 检验 了 由 该 @ 值 计算 的 C 值 的 显著 性 .检验 方法 同 本 
节 第 一 部 分 ,不 再 歼 述 . 若 样 本 的 已 值 是 显著 的 ,表明 总 体 中 两 个 
变量 之 间 存 在 着 相关 , 列 联系 数 C. 能 够 表示 相关 的 程度 ,或 说 ,以 
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列 联系 数 C 值 表示 总 体 的 相关 程度 是 合适 的 。 

列 联系 数 的 局 限 .C 系数 计算 简便 ,广泛 被 使 用 ,但 它 有 几 个 
局 限 .第 一 ,变量 完全 相关 时 ,C 值 不 等 于 1.。 一 般 来 说 ,一 个 令 人 满 
意 的 相关 系数 至 少 应 满足 两 个 特点 ;变量 完全 不 相关 时 ,系数 等 于 
0, 变量 完全 相关 时 ,系数 等 于 1, 列 联 系数 只 具备 第 一 个 特点 ,而 
不 具备 第 二 个 ,第 二 ,两 个 烈 联系 数 不 能 比较 ,除非 是 从 同样 大 小 
的 列 联 表 获 得 的 数据 .C 值 的 大 小 与 rc 的 大 小 有 关 。 当 ”> 一 时， 
车 两 个 变量 完全 相关 ,C = VG D .对 于 2X2 表 ,变量 完全 
相关 时 ,C = SO — D/A = 0.7071; MF 3X IRA CH= 
«(3 一 10/3 = 0.8165 .C 值 随 着 >.c 的 增 大 而 变 大 ,因此 ,由 不 同 
r.c 的 列 联 表 计算 的 列 联 系数 不 能 比较 。 第 三 ,为 保证 C 系数 的 正 
确 应 用 ,数据 必须 符合 XT 检验 计算 的 要 求 , 也 就 是 理论 预期 次 数 
不 能 小 于 5. 若 有 的 组 理论 预期 次 数 过 小 ,应 与 相 邻 组 合并 。 这 样 
做 会 使 分 组 变 得 粗糙 ,所 以 抽取 样本 时 应 适当 增加 数据 的 个 数 ,以 
避免 将 组 合并 .第 四 , 列 联系 数 不 能 直接 与 其 它 相关 系数 比较 , 例 
WM Spearman R Kendall T€. 

虽然 列 联系 数 有 这 些 局 限 ,但 由 于 它 适用 于 最 低 一 个 层次 的 
测量 扩 度 ,并且 对 总 体 的 分 布 形式 不 作息 设 , 因 此 具有 广泛 的 适应 
Tk. 

3. BEL V Ja X AK 

JL hp EE By V d X 3 Be (Cramers V Coefficient of 
Association) 避免 了 Y 值 无 上 限 ,C 值 上 限 不 到 1 的 不 足 , 是 一 个 较 
为 首 用 的 以 态 值 为 基础 的 相关 系数 。 其 计算 公式 为 


u Q 
Y= aminl@ — 1:6 — 1] (9. 9) 
根据 (9.5) Re= V Q/n 可 以 将 (9.9) 式 写成 


Dr = 时, 若 两 个 变量 完全 相关 ,由 (9,. ORA = alr — 1]; 代 入 (9.6) RB 
H C= vate — D/str — 12 2n = Yir— Dir, 
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V = Ype7min[(r — D.C — D] (9.10) 
分 母 中 min[tr — 00. — 10] SER RR O — 1) Ale — 1) 中 的 较 小 
者 。. 当 两 个 变量 不 存在 相关 时 ,F = 0, 两 个 变量 完全 相关 , 则 六 = 
1. 
Clo. 23 以 例 9.1 的 数据 计算 qs.C,Y 值 。 
解 ; 由 于 在 例 9.1 中 ,两 个 变量 相互 独立 的 零 假 设 被 拒绝 , 表 
明 谈 量 存 在 相关 ,利用 统计 量 Q SIT pC V 值 ,以 测量 相关 
的 程度 .入 = 23. 0508, = 337, min[ (rc 一 1),(C — DJ = 2, 可 得 
ES] 
p= fQ/n = /23.0580/337 = 0. 2615 i 
C= /Q/Q + n= v23.0580/23. 0580 + 337 = 0. 2250 
V = VQ/nminttr — D.,G — 1D] 
= 723. 0508/337(2) = 0. 1849 
-这 三 个 系数 的 值 愈 大 ,表明 两 个 变量 的 相关 程度 请 高 .在 r > 
2€ > 2 时 ,Yw 值 无 上 了 杞 ,可 能 大 于 1, Am p= 0. 2615 PEE BE 
UA AE ES 
对 3 Xx 3 表 , 当 两 个 变量 完全 相关 时 ,也 就 是 C B3 ELMAR 
0. 8165 ,相对 于 0.8165,C = 0. 2520 ARA GV to Si sig, 
是 一 个 较 好 的 测量 相关 程度 的 系数 .对 于 VV 二 1 来 说 ,7 = 0.1849 
比较 小 .因而 居住 地 区 与 电 风 肩 需求 型 式 的 相关 程度 不 够 高 .这 三 
种 相关 系数 p.C.V RRA MIR LOMB, BRS 
类 变量 ,所 以 其 应 用 受到 很 大 限制 


$9.3 列 联 表 的 PRE 测量 法 


在 实际 研究 中 ,仅仅 研究 变量 闻 想 关 程 度 是 不 够 的 ,往往 需 

要 利用 变量 问 的 相关 关系 ,从 一 个 变量 去 预测 另 一 变量 。 也 就 是 

说 , 在 测量 相关 时 ,能 够 得 知 进行 预测 将 消减 多 大 比例 的 误差 . 因 

此 ,PRE 测量 法 比 基 于 x* 值 的 测量 法 更 有 意义 , 列 联 表 的 PRE 测 

重 法 不 受 测 量 层次 的 限制 ,这 也 使 它 比 基于 X 值 的 测量 应 用 更 广 
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泛 . 列 联 表 的 PRE 测量 法 主要 有 以 下 几 种 ， 
— Lambda 相关 测量 法 


Lambda 相关 测量 法 是 以 4 系数 测定 变量 间 相 关 程 度 的 方法 ， 
适 用 于 定 类 变量 间 的 浏 量 , 当 一 个 定 序 变量 与 一 个 定 类 变量 间 测 
定 相 关 程 度 时 ,也 可 以 使 用 Lambda 测量 法 ,这 时 ,是 将 定 序 变量 
视 为 定 类 变量 .虽然 这 样 会 损失 定 序 变 量 所 提供 的 等 级 之 分 的 信 
县 ,但 却 使 统计 分 析 易 于 进行 

l. 437483 A 49 Lambda 相关 测量 

SRF PE Be ERMA RRA ARR X 影响 因 变 
BY WE. T Y ASMA PROP AE KA. B , 研 
究 出 生 时 间 和 智商 的 关系 ,一般 认为 出 生 时 间 对 智商 会 有 影响 ,而 
智商 不 会 影响 出 生 时 间 , 非 对 称 形式 的 Lambda 测 基 的 相关 系数 
以 ART. For REX EARR Y EHTE MERE XHY 
的 影响 程度 ,具有 消减 误差 比例 的 意义 。 
根据 


E,— E 
j 


Hr Xec 列 联 表 表 9 一 2, 可 以 得 到 4,, 的 计算 公式 。 

E, 的 和 定义。 当 了 与 藉 的 关系 未 知 时 , 敏 预 测 了 的 值 ,唯一 的 依 
据 是 了 的 边缘 分 布 , 即 表 9 一 2 中 的 列 边缘 次 数 广 全 一 1,2，r)。 
证 类 变量 的 代表 值 是 反映 集中 趋势 的 众 数 ,因此 ,预测 了 人 慎 时 的 最 
好 办 法 是 以 列 边缘 次 数 的 众 数 作为 了 每 一 个 值 的 预测 值 。 若 以 M, 
表示 了 变量 的 众 数 , 则 以 众 数 预测 了 慎 的 误差 E, 为 

E, —n — M, (9. 11) 

AP on 为 总 次 数 。 

E, FJgE 3,24 Y GX HRA BMY HPS 
X H(A aT, VERE X (US Ae ER Y 前 众 数 去 预测 该 条 
件 的 了 值 是 误差 最 小 的 ,以 mx, AMEX HARTET Y 的 众 数 ， 
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则 以 条 件 次 数 中 的 众 数 进行 预测 的 误差 E, 为 
E, =2n-— 3m, (9,12) 


式 中 ,2m, RIO Y ARIZA. RER ORE A 
= VEO. 11) 式 和 (9.12) 式 代 入 (9.10) 式 , 可 以 得 到 非 对 称 形 式 
"TET 
am, — M, 


Ave <= TH (9.19) 


[D 例 9.3] 出 生 和 事 节 与 智商 相关 程度 的 分 析 
出 生 时 人 间 对 智力 发 育 不 名 正常 有 多 大 的 影响 , 为 此 进行 了 调 
查 . 对 两 组 智力 不 驶 正常 的 人 的 调查 结果 如 表 9 一 12。 


E 9 一 12 HERAS 
HE CX) 
SCY 合计 
春季 EF 秋季 A3 
HH 18 29 18 12 77 


合计 38 42 34 32 145 


分 析 : 这 是 两 个 定 类 变量 亲 相 关 程 度 的 分 析 。 因 为 考察 的 是 
出 生 时 间 对 智力 发 育 是 否 有 影响 ， 及 以 是 非 对 称 关系 ,可 以 运用 
Ayo 系数 度量 相关 程度 。 

由 表 9 一 12 可 知 M, =-77, 春 季 出 生 人 的 智商 的 众 数 为 20， 
夏季 出 生 人 的 智商 的 众 数 为 29, 类 似 地 得 到 秋季 Y 的 众 数 是 18, 
ZEY fy WHE 20, 于 是 Xm, = 20 + 29 + 18 + 20 = 87,» = 
146。 将 上 述 值 代入 (9. 13) 式 得 到 


8 — 77 
= = 346 — 77 — — 0. 1449 


这 一 结果 表明 ， 用 出 生 季 节 去 解释 或 预测 智商 ， 可 以 减少 

14.49% 的 误差 。 
A 表示 工 受 天 影响 的 程度 ,也 就 是 以 X 变 量 解 释 或 预测 工 变 
BH ,减少 的 误差 .有 时 ,也 可 以 计算 As EER X SY Bein f 
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B. 

2. ARRIAGA 4j Lambda 测量 

ARM APRS XY 2 BARA, RORY BASE 
考察 哪个 变量 是 自 变 量 , 哪个 是 四 变量 , 则 这 种 情况 称 为 对 称 关 
Ro 例如 从 事 体 育 活动 和 收听 人 司 育 节目 之 间 往 往 是 相互 影 呈 的 关 
系 。 对 称 形式 的 Lambda 测量 是 计算 系数 。 

对 应 于 (9. 130 式 , 可 以 有 


Avy = Em. M, (9. 14): 


RAR A X SY RAR ER WETE 
间 的 相关 ,可 以 同时 计算 Aes FOAL, 取 其 平均 值 作为 相关 系数 , 即 
» | 
n — M, n — M, 
^T GM) Fao MS T GMT a MO 
_ 2m, + 2m, — (OM, + M,) 
i 2n — GM, + M) 
À E A, 与 A., BOE PIA d 
[ 519.41. 性 别 和 教育 程度 的 相关 分 析 
在 某 市 随机 抽取 1200 人 调查 ,结果 如 表 9 一 13。 


A, 


y 


(9.15) 


A 9 一 13 “性别 和 教育 程度 
性 5i 
教育 程度 ”一 -一 一 一 -一 一 一 一 一 一 & it 
E * 
Ah} REE 40 42 82 
y 中 82 176 358 
高 中 或 中 专 204 208 412 
Ee EE 200 148 348 


ü i 626 574 1200 


分 析 : 性 别 和 教育 程度 可 视 为 相互 有 关 的 两 个 变量 ,教育 程度 是 定 

FF 变量 ,这 里 将 其 视 为 定 类 变量 , 妈 只 考 虹 分 为 4 类 ,而 不 考虑 其 

等 级 .研究 两 个 定 类 变量 间 对 称 关系 的 相关 程度 , 可 以 运用 4 系 
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的 条 件 次 数 代 入 {9. 4) 式 得 到 
Q = 146(0.1107 + 0. 1526 + 0. 2600 + 0.0583 - 
+ 0.1238 + 0. 1091 + 0.0584 + 0.1812 — 1) 
= 146(1. 0541 — 1) | 
= 7.8986 
根据 给 定 的 显著 性 水 平 < 一 0. 05, H hË df= (r— 1)(c—1) 
= 3, 查 附 表 1 BAKRA = 7.82. HF Q = 7.8986 > Y = 
7. 82, 表 明 数 据 在 5% 的 显著 性 水 平 上 ,拒绝 H, Ee AR 
够 正常 的 人 群 中 ,出 生 季 节 与 智商 存在 着 相关 。 但 从 已 与 准 的 数 
EA Lxx — EE BH S 9 
AR 9 一 12 提供 的 数据 看 ,夏季 和 冬季 出 生 的 人 智商 差异 较 
KG 2X 4 列 联 天 变更 为 2 xX ORAM. SEMA 
9 一 15 是 出 生 季节 与 智商 的 2 X 2 表 。 


E 9—15 出 生 季 节 与 智商 
出 E 3 

"od 合计 
LES EE 

E E 29 12 ， 41 


很 4E 13 20 33 
& d 42 32 74 


| 分 析 : 为 研究 出 生 季 节 与 智商 的 相关 程度 ,应 先 检 验 在 这 群 
AR aE A A, 出 生 季 节 与 智商 是 否 存在 相关 .。 若 在 在 相 
关 , 再 计算 相关 系数 ,度量 相关 的 程度 。 
(Bao 出生 季节 与 智商 无 关 
A: HES SR AS 
将 表 9 一 15 的 数据 代入 (9. 4) 式 得 到 
人 = 74(0. 4884 + 0.1219 + 0.1098 + 0. 3788 — D 
= 74(1.0989 — 1) 
= 7.3186 
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车 以 显著 性 水 平 a 二 0.05,df = (r — DG — D — 1 ANS 
I ,483 = 3. 84, BRO = 7. 3186 > Yi — 3. 84,464 5% 的 
显著 性 水 平 上 拒 忽 五 ,. 当 a= 0. O1,df = 1 RF. = 6.64, HEE 
1% 的 显著 性 水 平 上 也 拒绝 五, ,表明 出 生 季 节 与 智商 之 间 存 在 着 
相关 。 这 一 结论 有 足够 的 说 服 力 。 
利用 表 9 一 15 的 数据 计算 AL 为 
_ (28 十 20) — 41 
y 74 — 41 
一 0.2424 
Aj, = 0.2424 表明 用 出 生 季 节 去 解释 智商 的 不 同 , 可 以 减少 
24.24% 的 珊 测 误差 。 这 显然 高 于 例 9.3 MER Le AR EB I 
可 以 得 知 ,在 这 些 智 力 不 够 正常 的 人 当中 ,夏季 出 生 的 人 智商 高 于 
稚 季 出 生 的 人 ,也 就 是 说 夏 .冬季 对 智商 的 影响 较 大 。 
[59.61 利用 表 9 一 13 的 数据 检验 其 市 的 性 别 与 教育 程度 
是 否 相 关 。 
AAA RE LI EATE. AE Yee ERS 
组 为 | 
Hy, 性 曾 与 教育 程度 无 关 
Hu 性 别 与 教育 程度 相关 . 
利用 表 9 一 13 的 数据 ,根据 (9.4) 式 计算 得 到 
Q = 1200€0. 0312 + 0. 1478 + 0.1614 + 0. 1836 
+ 0. 0375 + 0.1507 + 0. 1829 + 0.1097 — 1) 
= 1200(4. 0048 — 1) 
= 5.76 
a= 0.05.d§i=( —-1)(—-1) — 3, BRE 1,8% 2 — 7. 82, 
车 & =0.10,dí = 3,226 1,188] x2 — 6.25, RO IB 
SPE ni xn. Sig dE 520 A BEAR E ETA 1005 的 显著 性 水 
平 上 都 不 能 拒绝 如 ,因此 ,该 市 的 性 别 与 教育 程度 无 关 。 这 一 检验 
表明 , 例 9.4 中 计算 的 和 = 0,4 = 0. 004 确实 反映 了 性 别 与 教育 
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程度 的 相关 情况 。 

一 般 来 说 ,假设 检验 关心 的 是 总 体 是 否 存在 相关 ,也 就 是 以 样 
本 的 资料 来 推断 变量 在 总 悼 中 是 于 相关 ,而 相关 测量 法 是 研究 的 
变 量 在 样本 中 的 相关 程度 各 方向 ,假设 检验 要 求 样 本 必须 是 随机 
抽样 获得 ,而 相关 测量 法 则 既 可 用 于 随机 抽样 的 样本 ,也 可 用 于 非 
随机 抽样 的 样本 ,。 当 样本 是 随机 抽样 获得 时 ,一 般 应 先进 行 假设 检 
R., 以 判定 变量 在 总 体 中 是 否 存在 相关 ,车 存在 相关 ,再 测度 相关 
的 程度 。 . 


—.Goodman-Kruskal Tau 相关 测量 法 


Goodman-Kruskal Tau HAMBRE AS ATAR 
创造 的 ,采用 Tau 系数 测定 两 个 定 类 变量 间 的 相关 程度 .Tau 系数 
是 对 Lamhda 系数 的 改进 。 它 不 再 用 众 数 对 了 进行 预测 ,而 是 利用 
边缘 次 数 提供 的 比例 进行 预测 。 

l. 非 对 称 形式 的 Tau 相关 测量 

SAT REE XY 之 间 存 在 因果 关系 , 自 变 量 为 忒 , 因 变 
量 为 了 ,测量 其 相关 程度 ,可 以 采用 Tau 系数 ,也 记 作 e 系数 ,由 于 
是 非 对 称 关 系 的 相关 测量 ,因此 ,也 记 作 t, Tau 相关 测量 法 具有 
消减 误差 比例 的 意义 ， | 

E; MEX. XY HARA BI AJA AR 9 一 2 中 的 边缘 次 
ULA Y fe AAA S/n 是 Y, 值 的 概率 ,车 以 f/m 
IUS Y, 值 ,那么 误差 将 大 LO LID AW f,./n dt Y, 出现 的 
概率 ,而 i — f,./n 就 是 Y, 值 不 出 现 的 概率 .同样 的 道理 ,预测 Y, 
A S.C 一 fu ,预测 Y, ARAK AC 
等 等 .这 样 , 忒 了 关系 未 知 时 ,以 边缘 次 数 比 例 预 测 了 值 的 全 部 误 
ZE 为 

E, =f. — fn d-f.0- fue 

Hof, (1— fn 
-= fie t fe. bee + OF DG. fL dec fna] 
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—n— E fi/n (9. 16) 

E, 的 定义 , 当 X.Y 关 系 已 知 时 ,根据 表 9 一 2 中 的 条 件 次 数 比 
DURUM Y 值 ,条 件 次 数 比 例 A/S; 是 Y 值 出 现 的 概率 ,而 1 一 
f/f 是 Y; 值 不 出 现 的 概率 ,所 以 用 条 件 次 数 比 例 f/f., 预测 了 
值 的 误差 为 (1 — f/f.) SAFE A XA Y RAC WRK 
数 比例 预测 了 的 总 误差 E 为 

E, = fa TT 

po FK T Ff 


= (fat fam ED — EL 
+ at fat + fad Xf. 
tt Set fb + Se) E AI. 
—a— X Xf, n (9. 17) 
将 (9, 16) 式 和 (9. 17) 式 代入 (9.10) 式 ,得 到 Tau 测 量 系数 为 
E-E "72 fin —n-F z = ff. 
E n— X fin 


X 3 Alf — X fin | 
sO o (9. 18) 
n 一 EJ Fa 

[69.71 城乡 地 区 与 购买 电 风扇 信息 途径 的 相关 测量 

随机 从 城镇 ,乡村 两 个 地 区 抽取 10800 户 家 庭 调查 ,结果 如 表 
9—16, 

分 析 ; 表 中 提供 的 数据 是 两 个 定 类 变量 的 值 ,测定 城乡 地 区 
与 购买 电 风 启 信息 途径 的 相 闫 程度 ,是 为 考察 城乡 不 同 地 区 信息 
途径 是 否 不 同 ,对 两 个 不 同 地 区 是 否 应 采用 不 同 的 宣传 形式 ,所 
以 ,日 变 量 是 不 同 地 区 , 闪 变 量 是 不 同 的 信息 途径 .这 是 非 对 称 的 
XR HUA A] Tau 相关 测量 法 .运用 (9. 18) 式 计算 得 到 
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T 


a1- A ee A 805 A Oe A t av ktater ilii na Tht r =- 


H 9—16 bk HSE 1-9 BRE 


信息 途径 一 一 一 一 一 一 一 一 一 一 一 一 人 台 计 (7 


城镇 SH 
熟人 推荐 3191 1120 4311 
南 店 推荐 2370 1183 3553 
电视 广告 1286 528 1814 
Fe fecit 935 187 1122 
fito.) 7782 3018 10800 
319] | 2270 , — , 187| (43117 3553 + -» + 1122?) 
. 4.7782 TBZ O 3008] — 10800 
> 10800 — (4311%+ 3553 + 1814? + 11222)/10800 


_ 3338. 416 — 3310. 9269 
10800 — 3310. 9269 
= 0. 0037 

t, = 0. 0037 AUR 3 RENI a I RE., 
HEIR 0.37% 的 预测 . 困 此 ,试图 用 城乡 不 同 地 区 对 促销 采用 
的 宣传 形式 作出 决策 是 不 大 合适 的 。 

2. Tau 相关 测量 法 的 特点 。 

r, 的 取 值 范围 . 当 广 了 之 间 完 全 无 关 时 ,= 一 058 XY 完全 
相关 时 ,rm = 1 。 一 般 来 说 ,z, 值 越 接近 于 1, 3888 X. Y 间 的 相关 程 
度 越 高 ,以 苹 去 解释 了 ,能够 消减 的 预测 误差 比例 越 大 。 

r, 值 的 非 对称 性 ,zc, 值 表明 用 XX 去 解释 了 时 能 够 消减 的 误差 
EREA Y SURE OX BLY 为 自 变量 , 为 因 变 量 , 则 应 计算 z .一 
AR c.v c, APU YER PRAY HEP. 2X 2 Boe, = c, 

C 9.8) 利用 表 9—16 计算 7 

分 析 :r， 表明 不 同 地 区 对 购买 FB, LE 信息 途径 的 影响 ,tr。 3e RH 
, MRENA R BB RR dS Ee i DUREE RAE C9. 18) 式 可 
以 得 到 
319]? , 112 18721 7782: + 30187 


ll E TEA E DT 


T 10800 — (7782? + 301873 /10800 
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_ 52.7081 
4349. 2733 
= 0. 0121 
z,— 0.0121 KF r, = 0. 0037, WHU X REY PILL Y MERE X. BE 
ab E RAS UR BL (DIR [e] AR X ARR PTL A SE Y 的 信息 
与 Y 变量 中 包含 的 关于 XX 的 信息 并 不 是 等 量 的 。 

z 与 4 的 比较 .r, 与 4 都 测定 非 对 称 关系 的 定 类 变量 间 相 关 
程度 .但 其 依据 不 同 Ayo 以 众 数 作为 预测 依据 ,r, 则 利用 了 列 联 表 
中 的 每 一 个 条 件 次 数 。 相 对 来 说 ,zt, EL AL. E ALL E r 计算 
简 醒 ,一般 情 况 , 当 列 联 表 中 众 数 频次 比较 突出 时 , 宜 采 用 A f 
数 ; 变量 分 类 较 多 , 众 数 频次 与 非 众 数 频次 差异 不 悬殊 时 , 宜 采 用 
T, 系数 。 者 列 联 表 中 , 众 数 频次 集中 在 同一 横行 ,4,: SFE DAM 
运用 c, 系数 来 反 驶 变量 间 的 相关 程度 ， 

[$9.93 利用 表 9 一 13 计算 

分 析 :在 例 9. 上 4 中 ,计算 1. = 0, 这 是 因为 在 不 则 性别 下 的 教 
育 程度 众 数 频次 均 在 “高 中 或 中 专 ” 这 一 行 。 这 种 情况 下 ,用 4,, 测 
度 相关 程度 不 大 合适 ,可 以 采用 = SR. 利用 表 9 一 13 的 数据 , 根 
据 (9.18) $, e 


182* 1485| _ 827 + 358? + 412? + 348? 
. 1200 


T, 一 0.0019 ,表明 用 性 别 去 解释 教育 程度 ,可 以 消减 0.19% HB 
测 误 差 。 这 一 结果 与 心 - AR. 

3. XX HE 

5j Lambda 相关 测量 法 一 样 ,在 运用 Tau 相关 测量 法 测定 两 
个 变量 间 的 相关 程度 之 前 ,应 先进 行 显 著 性 检验 ,以 判定 总 体 中 两 
个 变量 是 否 存在 相关 .。 若 确实 存在 相关 ,再 计算 ,测定 相关 程度 。 
对 于 两 个 定 类 变量 ,检验 其 在 总 体 中 是 否 相 关 , 宜 采用 x! 检验。 
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【 例 9.10 年 龄 是 否 对 影片 的 评价 有 影响 
随机 抽 选 了 100 人 进行 调查 ,了 解 老 . 中 . 青 三 种 不 同年 龄 的 
人 ， 对 基部 影片 的 评价 是 否 存在 显著 差异 。 若 存在 ,测定 相关 程 麻 。 
调查 结果 如 表 9-17. 
分 煌 :研究 不 同年 龄 的 人 对 该 部 影片 的 评价 是 否 存 在 显著 其 
异 , 实 际 上 是 检验 变量 “年 龄 " 和 变量 “评价 ”之 间 是 否 相 互 独立 。 
A 相互 独立 ,两 个 变量 间 无 关 ; 若 相互 不 独立 ,两 个 变量 间 存 在 相 
关 。 这 一 检验 采用 X RBS. 
Ha 年 龄 与 评价 无 关 
五 :年 龄 与 评价 有 关 


E 9 一 17 年 龄 与 对 影片 的 评价 
年 de 
Lo E — m ait 
EF 中 年 We 

Pet fe 14 13 13 40 

评价 一 般 18 2 15 35 

评价 较 低 8 15 2 25 
E 计 40 30 30 100 


根据 表 9 一 17 数据 ,代入 (9. 4) 式 得 到 
& = 100[0.1225 + 0.2314 + 0.0640 + 0.1408 + 
0. 0038 + 0. 3000 + 0. 1408 
+ 0. 2143 + 0.0053 — 1] 
= 100[1. 2229 — 1] 
— 22.29 
ARE ac 0.05, dí = (r— Dic — 1) =4 HE 1.8 
BI xi = 9.49, BIR Q = 22.29 > 32 = 9. 49, BURT 5% HOB 
SES AS 
XENA LEH IAEA HA 
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r= a ee —--— 


c, 来 测定 相关 程度 .利用 (9 18) 式 可 得 到 
14 4 1848 , 18 4241 1] 科 十 1 和 9 十 天 1] 40° 4+ 35" + 25° 
| 40 + 30 + 30 | 100 
100 — (40% + 35? + 257)/100 


r, = 


6.6334 
^. $5.5 
— 0.1013 
t, = 0. 1013 表明 年 龄 与 评价 之 间 存 在 较 弱 的 相关 .以 年 龄 去 解释 
对 该 部 影片 的 评价 愉 能 消减 10. 13% 的 误差 。 
【 例 9.11】 之 庭 规 模 与 经 济 状况 的 相关 分 析 
从 某 地 区 随机 抽取 100 Prag Ee p ,结果 如 表 9— 18. 


HE 9 一 18 家 庭 规模 与 经 济 状况 
家 庭 规 A 
EARL 一 一 一 一 一 一 一 合计 
X Ay 
高 收入 2 44 48 
中 等 收入 32 10 42 
Ti AL 10 2 12 


Ss 计 44 56 100 


分 析 : 要 进行 家 庭 规 模 与 经 济 状况 的 相关 分 析 , 首先 应 利用 
调查 获得 的 样本 数据 ,判定 变量 “家 庭 规模 ”与 变量 “经 济 状况 ”在 
总 体 中 是 否 相 关 , 总 体 即 该 地 区 的 全 部 家 庭 ,因为 样本 取 自 该 地 区 
的 全 部 居民 户 之 中 。 

Hao 家 庭 规 模 与 经 济 状况 无 关 
Hi: 家庭 规 模 与 经 济 状况 有 关 
将 “经 济 状况 ”变量 视 作 定 类 变量 ,采用 检验 判定 ,根据 天 . 
9 一 18 的 数据 ,运用 (9. 4) 式 到 
Q = 100[3*/44(46) + 322744(42) + 
re + 27/5662) — 1] 
= 100(1. 5455 一 1] 
== 54.55 
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运用 Gamma 相关 测量 法 测定 两 个 定 序 变 量 间 的 相关 程度 ， 
其 目的 是 考察 根据 一 个 变量 的 某 一 等 级 去 预测 另 一 变量 的 等 级 
时 ,能 消减 的 误差 比例 为 多 大 .这 需要 利用 两 个 变量 等 级 之 间 的 关 
系 , 序 对 是 指 高 ,低位 次 的 两 两 配对 。 

同 序 对 是 X 变量 中 的 数值 与 了 变量 中 的 数值 变化 方面 一 致 

ext 49-19 是 三 个 职工 受 教育 程度 与 经 济 收入 的 列 联 表 。 由 
li 9 一 19 看 , 甲 、 乙 、 两 三 人 在 受 教育 程度 和 经 济 收入 方面 的 位 次 
有 如 下 的 关系 : 

受 教 育 程度 ， Z> Z>: >A 

经 济 收入 ， Hg lIZ4 gH 
K 土 述 关 系 可 以 看 出 , 乙 和 再 在 受 教 育 程度 与 经 济 收 入 上 的 位 次 
是 一 致 的 , 均 为 乙 > 再 ,这 是 一 个 同 序 对 。 甲 和 再 也 存在 这 样 的 一 
致 位 次 关系 ,所 以 也 是 一 个 同 序 对 , 表 9 一 19 有 两 个 间 序 对 , 记 作 
n, = 2, 

表 919 三 个 职工 的 王 教 育 程度 与 经 济 收 人 


受 教 育 程 度 


高 ER 
中 Z 
低 ps 
Fe PF At Ze BR PE AAA I] BCE + 
相反 的 序 对 。 表 9 一 19 中 , 甲 和 乙 在 受 教育 程度 ,经 济 收入 方面 的 
位 次 不 同 , 受 教育 程度 上 乙 高 ,经 济 收 入 上 却 是 甲 高 ;这 是 一 个 异 
FEST IE na = 1, 
同 分 对 是 变量 的 数值 等 级 相同 的 序 对 。 同 分 对 可 以 出 现在 变 
量 志 中 ,也 可 以 出 现在 变量 了 中 ,还 可 以 出 现在 两 个 变量 之 间 。 变 
量 于 中 的 同 分 对 记 作 了 ,变量 了 中 的 同 分 对 记 作 了 T,, 变 量 开 .了 之 
食 的 同 分 对 记 作 Ts. 
2. RK £& 69 Gamma 相关 测量 
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Gamma 相关 测量 法 具有 消减 误差 比例 的 意义 , 它 是 利用 同 序 
对 和 异 序 对 来 定义 系数 G 的 。 
OE, Ae eR XY 间 的 关系 未 知 时 ,以 区 的 等 级 去 预测 
Y 的 等 级 纯 属 随机 ,这 时 预测 正确 和 错误 的 概率 各 为 172, 若 总 的 
FETA n, 十 n,( 不 计 同 分 对 ) ,那么 预测 了 的 全 部 误差 E, 为 


E, = n2 + 24) (9. 195 


E, HEX. H XY CH SRER 已 知 ,那么 以 同 序 进行 预 
Eu , 即 对 于 序 对 (Cry) ` Cr; £M) Laa, A y, = yH r < 
x, 时 ,预测 y 交 。 这 样 预测 的 结果 ,可 能 错误 的 数目 为 异 序 对 数 
目 . 即 有 
E, = n, , (8. 20) 
将 (9. 19) 式 和 (9. 200 KALA CO. 10) 式 可 以 得 到 
G= E, 一 E, _ 1/20, + na) — n, 
N E, 7 1/2, + ny) 


A, — na 


Cam n (9. 21) 


(9. 21) AMA Gamma HAM ARCO. 2D 式 没有 考虑 了 
SS XY Bx. SES 

3. 列 联 表 中 n, 和 ns 的 计算 | 

列 联 表 中 的 调查 总 数目 = 一般 都 很 大 LOS TERE n FU nus ORE 
据 在 列 联 表 中 按 等 级 顺序 排列 ,如 表 9 一 20 BEAR. fi, 为 基础 分 
析 。 记 是 处 在 最 高 位 次 ,元 论 对 XX 还 是 Y, 取 ff 与 其 配对 , 则 在 六 
变量 上 的 等 级 与 Y 变量 上 的 等 级 方向 一 致 ,构成 同 序 对 ;同样 地 ， 
fu 5j feof A foes Fa 与 fos 配对 ,都 构成 司 序 对 ,因此 ,对 ES 
说 , 共 可 得 到 同 序 对 为 

fun + Fa + Fu + fa 


Eo 20 两 个 定 序 变量 的 3 xX 3 SUR 


y X 

高 rH ik 
rey fu fiz Pr 
中 fa Fo fas 
1% Fa Fa fa 


E fia 来 说 ,同行 , 同 列 的 均 形成 同 分 对 ， 
只 有 其 右 下 方 非 同行 非 同 列 的 才能 形成 同 序 对 ,这 一 规律 对 其 它 
位 置 上 的 频数 都 适用 。 

以 万 :为 基础 分 析 , 按 上 面 所 述 的 规律 ,与 其 同行 局 列 的 为 同 
分 对 ,在 其 左下 侧 的 构 不 成 同 序 对 ,因此 ,对 Ls 来 说 , 间 序 对 为 

Fok Ses + Fag) 
hs 不 可 能 与 其 它 频 数 移 成 同 序 对 ,依据 上 面 的 规律 ,fs 的 同 
FRA 
bn faa + fas) 

同 理 ,fs 的 同 序 对 为 La ,第 三 行 不 可 能 与 任何 一 个 频数 构 
成 回 序 对 ,所 以 同 序 对 的 总 数 为 上 面 4 类 之 和 , 即 

n, = fuf fu + Sos + fff) 

十 falfa + a + aa) 

S FESTE BY PA 3 FB 28 fe 85 Zr 33:45 380 lo 
去 ,再 会 去 某 一 频数 右 下 方 的 同 序 对 ,在 某 一 频数 左下 方 的 都 可 构 
成 异 序 对 。 表 9 一 20 中 的 异 序 对 总 数 为 

na = faa fa + Fa + Ad) + ftfa t fa) 

+ Falan + Fu + faf 

列 联 表 中 的 同 序 对 、 异 序 对 依据 上 面 的 准则 可 以 计算 得 到 ,将 m, 
na 代入 (9.21) 式 即 能 求 出 系数 G. 

[559.12] 经 济 状况 和 家 庭 规 模 的 相关 分 析 

认 某 地 区 荫 机 抽取 100 户 家 庭 调查 ,结果 如 表 9—21. 
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分 析 : 表 9 一 21 是 两 个 定 序 变量 按 从 高 到 低 的 顺序 排列 的 2 
x 3 列 联 表 , 研 究 变 量 “ 经 济 状况 ”和 变量 “家庭 规模 ”之 癌 的 相关 
Ee. FLAK AY Gamma MEA, 
计算 同 序 对 
n, = 2010 + 2) + 3202) = 88 
计算 异 序 对 
n, = 10044 + 10) + 32(44) = 1948 
H nana HAC. 21) 式 得 到 


^, —n, _ 88 — 1948 
n, F n, B8 i 1948 


= — 0, 9136 
we 9 一 21 S27 RASRENA 
经 济 状况 
FEE i 合计 
高 收入 中 等 收入 MELLA 
X 2 € 32 10 . 44 


小 44 10 12 56 


G 一 一 0.9136, 表 明 两 个 变量 间 存 在 负 相 关 ;,G| = 0.9136, 
接近 于 1, 表 明 两 个 变量 之 间 的 相关 程度 很 高 .由 于 G ABRAM 
IRS HAE. ik iG) = 0.9136 ,意味 着 ,以 经 济 状 况 的 相 
对 等 级 解释 家 庭 规模 的 相对 等 级 可 以 消减 91.36 免 的 误差 .因为 ， 
GC 系数 是 对 称 关 系 的 相关 测量 ,因而 也 可 以 说 ,以 家 庭 规模 的 相对 
等 级 解释 经 济 状况 的 相对 等 级 可 以 消 厂 91. 36% 的 误差 ,经 济 状 
况 与 家 庭 规模 旦 负 相 关 , 表 明 一 个 变量 等 级 愈 高 , 另 一 变量 等 级 登 
低 , 即 经 济 收 入 越 高 ,家 庭 规 模 越 偏 小 。 . 

4. Gamma 相关 测量 法 的 特点 

系数 的 取 值 范围 . 当 不 考虑 同 分 对 时 ,车 n = 0, 即 数据 都 
是 同 序 对 , 则 6 = 1,28 n, = 0, 即 数据 都 是 异 序 对 , 则 G = 一 1, 所 
LAG 系数 的 取 值 在 [一 1, +11 区间 .车 数据 中 以 同 序 对 为 主 , 即 
n, > ne i] G > 0, 表明 两 个 变量 呈正 相关 ;车 数据 以 异 序 对 为 主 ; 
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ad — bc 
(a Tr 6G cr DG ro +a). 
60(12) — 0 
/^/ 10802) (60060) 
= 0.33 
计算 QQ 系数 为 


p= 


出 于 在 这 一 研究 中 ,关心 的 是 服用 新 药 能 否 不 患 肝 炎 ,而 对 服用 原 
有 药 是 香 能 不 患 肝炎 不 感 兴趣 ,因此 ,采用 久 系 数 更 适宜 ,也 就 是 
说 用 六 系 数 反 映 新 药 与 肝炎 的 关系 更 合理 。 
2 X 2 表 中 的 外 系数 可 以 看 作 C 系数 的 特例 。 
-- 5, Gamma 素数 的 检验 
利用 随机 样本 数据 计算 的 殷 系 数 ,是 否 能 用 以 推断 总 体 , 必 须 
进行 统计 检验 ,建立 的 假设 组 为 

| Ho: 总 体 中 G=0 

AL: BMA G 4 0 
TES GC — 0 或 G 之 0, 也 可 以 建立 单 伍 备 择 , 即 

Ay: G=0 Hau G=0 

Ho G>0 Ho. GXO 
为 判定 假设 ,需要 采用 随机 抽样 获得 数据 ,数据 至 少 是 定 序 尺 度 测 
Bog XB E 

ln t na 
l Aza (9. 232 
其 中 ,G ne GARR n. 是 列 联 表 中 的 同 序 
对 . 异 序 对 ,= 为 样本 数据 的 数目 ,统计 量 Z 是 G 系数 标准 化 的 结 
果 , 当 # 字 10 时 , 它 近 似 为 标准 正 态 分 布 ,因而 可 以 在 附 表 N 中 ， 
查找 到 Ae 成 立时 ,Z OS ACC NUR P EP 与 给 定 的 显著 性 水 
Ea 比较 ,者 PP 足 驶 小 , 则 数据 拒绝 AL, UES E, :利用 统 
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计量 Z 作出 判定 ,也 可 以 在 附 表 N 中 ,根据 给 定 的 显著 性 水 平 查 
找 临 界 值 Z., 即 确定 单 侧 检 验 的 否定 域 ZA >Z PBZ LB 
落 和 人 否定 域 , 则 拒绝 A, ,否则 不 能 拒绝 五 。 若 检验 为 双 侧 的 ,应 以 
0/2 查找 附 表 N 中 相应 的 临界 值 Zaro 
rf) 9.14] 茶 地 区 的 家 庭 中 ,家 庭 规 模 是 否 随 经 济 收入 升 
高 而 变 小 
FIR I 9. 12 中 某 地 区 家 庭 状 况 的 调查 资料 ， 能 否 说 明 该 
的 居民 家 庭 ,经 济 收入 等 级 越 高 ,家 庭 规模 越 小 。 l 
分 析 : 在 例 9. 12 中 ,调查 的 样本 是 随机 抽取 的 ,利用 样本 数据 
计算 的 G — — 0.9136, 表 明 家 庭 规模 与 经 济 收入 呈现 高 度 的 负 相 
关 。 能 否 将 这 一 结论 推断 到 该 地 区 居民 家 庭 ,应 进行 检验 ,由 于 研 
究 的 是 经 济 收 入 越 高 ,家 庭 规 模 越 小 ,因而 建立 单 侧 备 择 ,假设 组 
为 x 
Hy: G=0 
Ho. GO 
tH dE X 9 一 21 HH n, = 88,14 = 1948, = 100,G =— 
0. 9136, f£ A. C9. 23) 式 , 得 到 


DE i 88 + 1948 
Z = (— 0. 9136), 100[1 — (— 0.9136)27] . 


— 10. 1393 
SEREF EKF a = 0. 001, 则 在 附 表 N 中 可 以 查 到 单 侧 
检验 的 临界 值 Z。 = = 3.09, 即 否定 域 为 |Z| > 3.09。 显 然 统计 量 
IZ] = 10.1393, 落 入 否定 域 ,所 以 数据 拒绝 H,, 若 以 |2| = 
10. 1393 在 附 表 N 中 查找 H, 成 立时 的 概率 可 得 到 P< 0. 0002. 
这 是 一 个 相对 于 & = 0. 001 ERNA ER RUSA 五 
研 完 的 结论 是 :该 地 区 居民 家 庭 的 规模 与 经 济 收 入 成 反比 ， 家 
庭 规 贷 基 随 经 济 收入 的 升 高 而 变 小 。 


.Somer's d 相关 测量 法 


Somer's d 相关 测量 法 亦 称 d 相关 测量 法 ,是 通过 计算 a 系数 
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= 168 + 110 + 48 + 64 
= 390 - 
T, = 38€ + 4) + 50D + 1806 + 6) + 1666) 
+ 4(4+ 5) + 4C5) 
= 342 + 20 + 396 + 96 + 36 + 20 
= 910 
根据 (9, 24) 式 可 以 计算 得 到 


d Oa 1475 — 390 
"^on n tT, 7 1475 + 290 — 910 
— 0. 3910 


dy = 0.3910 表明 父母 的 教育 态度 对 子女 的 学 习 成 绩 有 一 定 的 束 
Wa. 二 者 成 正比 即 父母 的 教育 态度 盖 好 ,相对 来 说 ,子女 的 学 习 成 
绩 要 高 ,以 父母 教育 态度 好 坏 预 测 说 明子 女 学 习 成 绩 的 高 低 可 以 
削减 近 40% 的 误差 。 

dy 系数 与 避 系 数 都 应 用 了 同 序 对 ,和 蜡 疗 对 ns 但 G 系数 未 
考虑 同 分 对 ,而 心 -系数 则 考 虚 了 .一般 情况 下 ,研究 的 两 个 变量 是 
对 称 关系 , 即 不 研究 哪 一 个 变量 为 自 变量 , 嘟 一 个 为 因 变量 ,采用 
C 系数 测定 相关 程度 ; 若 研 究 的 两 个 变量 需要 区 分 自 变 量 、 因 变量 
时 ,应 采用 du 系数 或 doy 系数 测定 相关 程度 ,在 社会 现象 的 研究 
PEA AER AEREI F. CEN GAR, BAHR 
BPE ICR PAS 

3.4 打数 的 检验 

者 样本 是 随机 抽样 选取 的 ,那么 能 否 用 样本 资料 来 推断 两 个 
变量 在 总 体 中 是 否 相 关 需 要 进行 统计 检验 .在 a 系数 的 计算 中 ,分 
子 是 同 序 对 与 异 序 对 的 差 值 , 即 有 

5-—n,—n, 
记 就 是 说 ,3 5 BggbtiESGgBXSxs-oMx5Yz 
IRI ETE ZU AS ES 关 0, 则 存在 等 级 相关 .利用 S 因子 的 数 
值 ,可 以 对 总 体 是 否 存在 等 级 相关 进行 检验 。 
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很 据 研究 问题 的 需要 ,可 以 建立 双 侧 备 择 , 也 可 以 建立 单 侧 备 
FE 20008 PRA 
Ii: Hpk H S = į] 
Hi; 总 体 中 S = 0 
PE S Eg C 
Ji, S=0 FH, S0 
Ho. 820 H, 3«0 
yt RE AL EA Z.Z 的 计算 公式 为 


z2 
Z=% (9. 26) 


式 中 ,$ 是 S 的 修正 值 

S = |s| -zp DeD 
这 里 ,r.c 分 别 是 列 联 表 的 行 数 , 列 数 ,n ARANA 
(9. 26) 式 中 的 S, ES 的 标准 误差, 其 计算 公式 为 


s |A,B, AB, + As, | A.B, 
i n—] nin — 1) n(— ijin — 2) 

这 里 ,4: 是 天 变量 边缘 次 数 中 ,每 2 个 频次 乘积 之 和 LAS 是 每 3 个 
PDA HB: 是 Y 变量 边缘 次 数 中 ,每 2 个 频次 乘积 之 和 +B, 
是 每 3 个 频次 乘积 之 和 。 

检验 统计 量 Z 近似 正 态 分 布 ,可 以 在 附 表 让 中 , 查 得 与 给 定 
的 显著 性 水 平 相 对 应 的 临界 值 Z。: 和 将 2Z 与 2 比较 , 若 1Z| Ze Za UJ 
TE Ao tr WAS ARIE 五 ,。 若 检验 为 双 侧 的 , 查 附 表 N 时 ,应 以 
2/2 BRAY AS Zare 

(49.161 子女 的 学 习 成 绩 高 低 是 否 随 父 母 的 教育 态度 好 
坏 而 变化 | | 

i8 Hif 9.15 的 调查 结果 ,分析 该 地 区 的 子女 学 习 成 绩 与 父母 
教育 态度 的 关系 。 

分 析 : 表 9 一 24 的 数据 是 在 某 地 区 随机 抽样 调查 得 到 ,以 样本 
数据 计算 的 4,: = 0. 3910, 这 一 结论 是 否 能 用 来 推断 总 体 , 要 进行 
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检验 。 利 用 上 面 介绍 的 和 检验 法 ,建立 的 假设 组 为 
Ho: EATS = 0 
Hi: BiH S > 0 

由 表 9 一 24 可 知 :n = 100,r = 3,0 = 3, AREA 


100 
S = HATS — 390| 2G2DGD 


i 


= 1072.5 
HA 9 一 24 B X.Y 的 边 绿 次数 计算 出 来 列 入 表 9-25 中 ,可 
以 得 到 
A, = 60025 + 15) + 25015) 
= 2400 + 375 
= 2775 
A, = 600250 (15) 
= 22500 
B, = 47(40} + 4703) + 40013) 
= 3011 
B, = 47(400(13) _ 
= 24440 
&9—25 父母 教育 态度 与 子女 学 习 成 二 
EREE 
“Fie at at CY) -一 一 一 -一 一 一 一 一 -一 合计 
好 中 = 
B 38 5 4 47 
中 18 16 . & 40 
E 4 4 5 13 
合计 60 25 15 100 
于 是 


ATIGI 2775(24440) + 22500(3011) 22500(244405 


100 — J 1000100 — 1) + 1000100 — 150100 — 2) 
= 266.963 
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根据 (9. 26) 式 可 得 


了 S' _ 1072.5 
SS, 266.963 
= 4.0174 


若 给 定 显 著 性 水 平 = 9. 001, 则 在 附 表 N 中 可 查 得 临界 值 
为 了 .= 3.09,。 和 否定 域 为 | 了 | 之 3.09。 显 然 ,Z = 4.0174 已 落 入 否定 
域 ,数据 拒绝 瑟 ,. 结 论 是 ,该 地 区 子女 的 学 习 成 绩 与 父母 的 教育 态 
度 成 正比 ,父母 教育 态度 愈 好 ,子女 学 习 成 绩 愈 高 。 


五 .相关 比率 测量 法 


相关 比率 (correlation ratio) 亦 称 eta 平 方 系数 ,写作 eta: 或 简 
BA E' . 它 用 来 测定 一 个 定 类 变量 CX) 或 一 个 定 序 变量 (X) 与 一 
个 定 距 变量 (Y) 之 间 的 相关 程度 .有 时 也 记 作 好 ， 

1 不 对 称 关 永 的 五 REA 

将 定 类 变量 或 定 序 变 量 作为 蕊 , 定 距 变量 作为 了 ,那么 E 的 
计算 公式 为 

Qo Eny, — ny 
E = Sy ny 
HAERES] SAMS ARE: 
样本 观察 值 总 数 ,n = En; 
因 变 量 的 数值 ; 
Si 组 的 因 变量 均值 ; 
因 变 量 的 均值 。 

E 共有 削减 误差 比例 的 意义 。 当 瑟 了 的 关系 未 知 时 ,最 好 的 
预测 量 以 因 变 量 Y 的 样本 均值 预测 因 变量 的 每 一 个 值 ,这 时 的 全 
部 误差 五 | 为 l 

E, = Xy 一 yy? (9. 28) 
FAXY 的 关系 已 知 ,这 时 以 与 zx; 对 应 的 因 变 量 的 样本 均值 又 作为 


D 采用 平方 值 是 为 避免 离 差 的 正 负 抵消 。 
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(9. 27) 
AF: 


Ile s 3 


该 组 的 预测 值 最 好 , 误 善 将 为 组 内 离 差 平方 和 
E, = X(y — Y (9. 29) 
RE PRE 的 公式 可 以 得 到 
E,— E, Xíw—yY Ely — yp) 


PRESSE 7/00 3G»! 
_ Say? — ny 
(Xy — ny! 
= E 


[49.171 居民 的 收入 与 文化 消费 支出 是 否 相关 。 
在 某 地 区 随机 抽 选 了 20 名 居民 ,对 其 收入 和 与 用 于 文化 娱乐 消 
费 的 支出 进行 调查 RA 9 一 26。 
表 9— 26 居民 收入 与 文化 消费 支出 


BA CX) 
高 收入 中 等 收入 LA 
4.20 3. 20 3. 10 
x 
n 3.00 > 2. 90 2. 80 
消 2. 90 2.70, 2.20 
9 (Y) 3. 20 2.10. 1.10 
X 2.10 1.90 2.00 — 
出 3.10 3.10 2.50 
(JD? 
2. 30 2. 80 


分 析 : 由 于 居民 收入 是 按 定 序 尺 度 测量 ,文化 消费 支出 是 定 
化 尺度 测量 ,测定 其 相关 程度 ,可 以 采用 E* 系数 。 
由 表 9 一 26 可 以 计算 得 到 

Hj — Yen: 二 7 一 6 一 Pi 十 mr 十 mr 一 20 

Y, = 3,0571, y, = 2.8714, y. = 2.2833, y = 2. 69 

Xy = 152. 64 
代入 (9.27) 式 有 
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相 美 比率 的 检验 统计 量 了 可 以 不 先 计算 E* ,而 根据 方差 分 析 
的 方法 计算 . 单 因 素 方 差分 析 的 基本 原理 是 将 因 变 量 的 全 部 高 差 
平方 和 ZY — YO! BE E, 分 解 为 两 部 分 :削减 的 误差 平方 和 和 剩余 
的 误差 平方 和 .削减 的 误差 平方 和 即 E, — 五 ,也 就 是 由 于 引进 家 
变量 X 米 解释 Y 的 变化 所 能 前 碱 的 误差 平方 和 , 称 为 组 间 离 差 平 
方 和 , 记 必 BSSKetween-groups sum of sguares), 由 (9.28) 3C, 
(9. 290 RA: 
BSS = Xy — yY — ZX(y — yy 
= Em yi — ny? 
= my, — yy 
MATE TAREA AE ARE Y RA A 
A A. RAZA OES A. ip fp WSSCWithin-groups sum of 
sguares), (9.293 #47. 
WSS = My — y)? 
于 是 就 可 以 构造 检验 统计 量 玉 .BSS 和 WSS 分 别 除 以 各 自 的 自由 
度 有 一 1 各 x 一 ,得 到 被 前 碱 的 方 关 和 剩余 的 方差 ， 两 个 方差 之 


Hae Fa Bap 
_ BSS/(k — 1) 
~ WSS/@ — &) 


2 Suy — y) KR — 1) 
(EX — y (a — E) (9. 3) 
(9. 300 AGO. 31) 式 是 等 价 的 . 仍 用 表 9 一 26 的 数据 接 (9. 3D 式 
计算 检验 统计 量 F A 
fo 130571 — 2.69)? + 7(2. 6714 — 2. gp + 6(2. 2833 — 2. 03)? ]/(3 — 1) 
L4. 20 — 3.0571)* + (3.00 — 3.0571)? F e + (2.50 — 2. 2833)" ]/(20 — 3) 
.. i 9381/2 
~ $.9799/17 
= 2.15499 


在 列 联 表 的 PRE 测量 法 中 ,上 述 几 种 较为 常用 。 在 选择 时 ,应 


@ 69-31) XB PEGO. 30) RH F RSH FE HAWES. 
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首先 考虑 变量 的 测量 层次 ,其 次 才 是 关系 的 对 称 与 否 。 和 将 介绍 的 几 
种 方法 妇 钠 列 入 表 9 一 27. 当 列 联 表 的 数据 是 从 基 一 总 体 随 机 折 
样 获得 时 ;车 以 样本 推断 两 个 变量 在 总 体 中 是 否 相 关 , 应 采用 表 中 
最 后 一 列 的 检验 方法 进行 判定 。 . 


Me 0--27 两 个 变量 的 PRE 测量 方法 
测量 层次 HXEX%S E [ei f EH Ti Bt EE Se 
定 类 一 ER ACAD [o, 1] " 
rex] r, to, 1] X 检验 
定 序 -- 定 序 C bmi +L z Hm 
dz [—1, +1] 
ER— | E: [o, 1] FRE 


定 序 一 ENE 


BTE “对 数 线性 模型 


列 联 表 能 够 反映 定 类 变量 间 较 为 复杂 的 关系 ,相应 的 统计 检 
验 及 相关 测量 法 , 能够 用 来 研究 变量 间 的 真实 相关 性 和 程度 。 但 
E SESE FE ALT a GA EN, BS 
析 模 型 ,这 对 描述 变量 间 关 系 是 很 不 方便 的 .对 数 线性 模型 是 解决 
这 一 问题 的 极为 有 效 的 方法 .虽然 按 照 有 无 实 参数 的 定义 来 划分 ， 
这 种 方法 不 能 算 作 非 参 数 统计 方法 ,因为 模型 有 参数 估计 问题 .但 
它 对 定 类 数据 ,也 包括 定 序数 据 建立 模型 很 有 效 . 受 篇 杜 限 制 本 书 
仅 简介 对 数 线性 模型 ,以 使 读者 能 更 好 地 了 解 .掌握 和 运用 这 一 方 
法 ， | 


$10.1 高 维 列 联 表 


当 研 完 两 个 定 类 变量 时 ,采用 的 是 二 维 列 联 表 。 但 许多 问题 的 
斌 究 , 往 往 涉及 三 个 或 三 个 以 上 的 变量 .如 居民 对 电 风 肩 的 需求 型 
式 , 可 能 与 居住 地 区 、 家 庭 结构 等 有 关 , 这 时 ,二 维 列 联 表 无 法 使 
用 ,而 必须 采用 高 维 列 联 表 . 维 是 指 变 量 , 若 涉及 三 个 变量 , 则 采用 
三 维 列 联 表 , 若 涉及 四 个 变量 , 则 党 用 四 维 列 联 表 , 以 此 类 推 ,可 以 
得 更 高 维 的 列 联 表 , 实 际 上 ,从 三 维 表 推广 到 四 维 或 更 高 维 表 , 除 
本 增加 分 析 的 复杂 性 外 ,不 存在 更 多 的 新 问题 ,因而 本 书 仅 就 三 维 
表 作 一 些 分 析 。 


二 维 列 联 表 只 有 行 、 列 ,而 三 维 列 联 表 维 数 和 天 高 后 , P in 

“ 层 ”(Layer), 即 具有 行 、 列 、 层 个 类 别 。 仍 以 rc 分 别 表示 行 、 列 ， 

层 用 7 表示 , 则 三 维 列 联 表 是 > X c X ZL 表 。 例 如 ,居民 对 电 风 读 的 

需求 型 式 涉及 三 个 变量 :第 一 个 是 需求 型 式 ,可 分 为 台式 ,和 台地 式 ; 

第 二 个 是 居民 居住 地 区 ,可 分 为 热带 ,温带 .寒带 ;第 三 个 是 家 庭 结 
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PARAR A ZE. HRRERAUELRE, 调查 结果 如 表 
10—1 . 表 中 每 格 也 称 作 每 单元 的 观察 次 数 记 作 Fin G = 1,2) ry 
j=l; esci = 1,2) DMA PERRA, BY LA BB 
个 边缘 次 数 的 总 和 。 
3; 10 一 1 居民 的 电 有 风 遍 需求 型 式 单位 ,万 省 
居住 地 区 (1) 


一 一 一 一 一 一 一 一 一 一 一 一 合计 
Th d Aa + E $ 
家 庭 结 构 (3) 两 代 三 代 以 上 WR 三 代 以 上 两 代 三 代 以 上 
BENE 台 -OA 1£ 16 15 14 8 6 77 
a [:L 25 28 30 28 12 5 138 
E ił 43 44 45 42 20 21 215 


单个 变量 边缘 总 次 数 . 在 上 .7 上 对 所 有 Fa ERA S ERU AB 
类 的 次 数 总 和 # 知 在 了 关上 对 fin 求 和 ,得 到 第 i 行 类 的 次 数 总 和 ， 
若 在 ;上 对 fus 求 和 ,得 到 第 j 列 类 的 次 数 总 和 ,其 计算 公式 如 
CLO. 1D 式 。 这 是 对 两 个 下 标 求 和 的 结果 。 利 用 表 10— 1 数据 可 以 计 
算得 到 


c E 
f... 一 X Z2 fu 
J 一 1 k=] 
r t 
了 = 5 = fu C10. 1) 
i i=] ł=1 
f. a P Xfa 


fi. 184+ 169+ 0540-140 4-8 07-6) — 77 

fa. = 484+ 252 + (15 + 30) + (8+ 12) 一 108 

fa =18+ 16 4-25 — 28 = 87 
Ji. 表示 需求 台式 电 风 扇 的 数目 ,上 表示 家 庭 为 凋 代 人 结构 的 电 
风扇 需求 数目 ,/.: 表示 热带 居民 电 风 局 的 需求 数目 ,类 似 地 , 根 
据 表 10 一 1 还 可 以 计算 l 

台地 式 电 风扇 需求 数目 
fi.. = (25 + 28) + (30 + 28) + (12 + 15) = 138 
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三 代 人 及 三 代 人 以 上 家 庭 电 风扇 需求 数目 
fa. (18+ 285 + (14+ 28) + (6+ 15) = 107 
AAA DX FB RA dar SOC H 
Fig = 15 + 14 + 30 + 28 = 87 
寒带 地 区 居民 电 风扇 需求 数目 
了 一 8 十 12 十 6 十 15 一 41 
两 个 变量 边缘 总 次 数 。 对 单个 下 标 求 和 ,可 以 得 到 两 不 变 量 
边缘 总 次 数 . 其 计算 公式 如 (10, 2) xX, 


I 
f£. = 2 Fin. 

4=1 
fac i Fig (10. 2) 
Foa = E p 


表 10—2 是 根据 表 10 一 1 数据 ,通过 对 第 三 个 变量 , 即 下 标 * 上 求 
和 得 到 的 。 


Y 10—2 RESDARKHAHUWR KH 
家 E A H 
需求 型 式 
BE S =RALLE 
台式 4i 35 
台地 式 57 71 


其 中 fu. =18+15+8= 41 

Lu. = 16 + l4 + 6 = 36 

Fa. = 25 + 30 + 12 = 67 

2) = 28 + 28+ 15 = 71 
类 似 地 ,可 以 通过 对 第 一 个 变量 , 即 下 标 守 上 求 和 ,得 到 第 二 ,三 个 
变量 的 边缘 总 次 数 ; 对 第 二 个 变量 即 下 标 i 上 求 和 ,得 到 第 一 .三 

. 个 变量 的 边缘 总 次 数 .同样 地 可 以 绘制 出 如 上 的 表 。 
列 联 表 总 次 数 , 通 过 对 三 个 变量 求 和 ,可 以 得 到 列 联 表 的 总 次 
S .其 计算 公式 如 (10. 3) x. 
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r E i 
n=f.=3 3 3 fy (10. 3) 


1 一 1 ¡=1 4=1 


二 ,独立 性 检验 


在 二 维 列 联 表 中 ,由 于 只 涉及 两 个 变量 ,因而 独立 性 检验 的 假 
设 也 仪 涉及 两 个 变量 之 间 . 高 维 列 联 表 中 涉及 的 变量 多 于 两 个 , 因 
而 可 能 研究 的 是 所 有 变量 间 是 否 相 互 独立 ,也 可 能 希望 检验 其 些 
T 量 与 其 它 一 些 变量 相互 独立 ,或 是 某 一 特定 变量 与 其 余 变 量 无 
大 。 为 此 ,高 维 表 变量 间 独 立 性 检验 的 假设 , 比 二 维 表情 况 复 杂 。 

1l. 三 个 变量 相互 独立 性 的 检验 

者 三 个 变量 分 别 记 作 XYZ. We = E a 
设 组 为 


fy, X.Y 2 aH SRL 

Ay, XY ZAARA 
为 对 假设 作出 判定 ,与 二 维 表 独 立 性 检验 相同 ,首先 需要 确定 H, 
为 真 时 的 检验 统计 量 ,然后 得 到 其 抽样 分 布 , 再 确定 PP 值 ,以 态 , 为 
真 时 ,检验 统计 量 为 某 值 的 概率 了 的 大 小 作出 拒绝 或 不 拒绝 五, 的 
判定 。 
0 设 某 一 观察 值 出 现在 第 ij 格 中 的 概率 为 pra Ci 二 11,2 ,rs 
j 一 12 二 12 第 : 行 .第 7 列 ,第 & 层 变量 的 边缘 概 
ABI Pes Pao bas] XYZ 相互 独立 时 有 

Pip = PP Por 
RI H, A 

Ho: bis = PPP. 
4 H, 为 真 时 , 即 pin 一 PP p.a AL SB LR 格 的 期 望 次 数 为 

Pik = AP. .PjP.r 
AE Poo Po bas ARAS A ELTE E 0 33 
ES E 


Por 一 Ls 
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= ff fain? (10,4) 
实际 次 数 jx 与 期 望 次 数 au 越 接近 ,表明 变量 间 相 互 独立 的 可 能 
HAR RS fio 与 e, 的 差 值 越 大 ,表明 变量 向 相互 独立 的 可 能 
PERU RITE OBR Sea 差 值 大 小 的 一 个 很 好 选择 ， 
这 与 二 维 表 的 独立 性 检验 一 样 ,@ 的 计算 如 (0. 5) 3X. 


Fr č i — , e 
Q= 33 5 Lx (10.5) 
;一 1 j=l 4=1 £i 


高 维 列 联 表 情况 下 AD! 
得 到 。 

df 一 〈 表 的 格 数 一 D 

一 (为 检验 特定 假设 须 估计 的 概率 数目 ) (08) 
在 三 维 表 中 ,r X X i 的 格 数 为 ret。 为 检验 召 ,, 需 要 估计 概率 
Pip. 和 pinot 户 … 来 说 要 估计 > 个 ,但 由 于 概率 和 为 1, 因 此， 
只 需 估 计 {r 一 1) 个 即 可 。 同 理 , 对 于 p. HBL BRIT Ce — D 个 ， 
Mp MIC — D 个 。 对 于 A, 为 真 来 说 ,统计 量 入 的 自由 度 为 
df = (rel — 1) — (r—1)— (e-D—(2-1) 
— rcd-——r-—c—i42 

确定 已 值 .在 附 表 I 中 ,根据 此 ,可 以 查找 H, WAQAR 
值 的 概率 一 ,将 已 与 显著 性 水 平 比较 , 若 忆 足够 小 , 则 拒绝 HUE 
P 3HXE o 较 大 , 则 不 能 拒绝 再 ,. 与 二 维 表 的 独立 性 检验 一 样 ,也 可 
以 在 附 表 1 中 ,根据 和 f 和 显著 性 水 平 a, 查 找 临 界 值 A BIE 
5E QI xf ER AO < x2. BETES Ho. 

[6110.13 利用 表 10 一 1 的 调查 结果 ,分 析 说 明 居 民居 住地 
区 .家庭 结构 与 电 风 扇 需 求 型 式 间 是 否 相互 独立 

分 析 : 设 居民 家 庭 结 构 , 电 风扇 需求 型 式 、 居 住地 区 分 别 为 变 
E 和 了.Z ,研究 三 者 间 是 否 相互 独立 ,是 对 所 有 变量 之 各 相互 独 
立 性 进行 检验 ,建立 愿 假设 为 
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Ho: fuo Poe Pope Pore 
E] X.Y.Z 间 相 互 独立 
根据 表 10—1 和 (10. D 式 及 (10.4) 式 , 可 以 计算 得 到 各 个 其 
HRE eu MR 10 一 3。 其 中 ， 
en = Li f ad-an? = 770108) (873 /215* 一 15.65, 
eni = Lua faf n! = 138008) (87)/215* = 28. 05 
其 余 期 望 次 数 的 计算 类 似 。 出 表 10—1 和 表 10 一 —8 可 以 得 到 检验 
统计 量 g. 
4X10—3 ”三 个 变量 相互 锤 立 假设 下 葛 期 望 次 教 
居住 地 区 (4) 
热带 温带 寒带 
REGIO 两 代 三 代 以 上 两 代 三 代 以 上 两 代 三 代 以 上 
需求 型 式 6 式 15.65 15.51 15.65 15.51 7.38 7.30 77 
G) wt 28.05 27.79 28.05 27.79 13.22 13.10 138 


np 
wl 
+ 
由 
Ln 
-3 
EN 
La 
E 


43.7 43.3 206 20.4 215 


Q = y y 5 (Fin — End 


r=] ¡=1 t=1 ©, pk 
| (18— 15.65)? , (16 — 15.517? (15 — 13. 10? 
zn 15.65 + 15. 51 unb 13.10 
= 1. 6846 


fru» 1 ra = 0. 05,df = rel —r—e —1+2=7. BAM AA os 
= 14. 07, H FQ = 1. 6846 < Xio 一 14.07, 数 据 不 能 拒绝 Ho HE 
明 在 5 多 的 显著 性 水 平 上 ,三 个 变量 相互 独立 。 

实际 运算 时 ,统计 量 急 的 计算 公式 还 可 以 采用 另 一 种 形式 , 即 
(10. 7) XX, 


Q= "[£8 52 YA RG -— +) (10. 7) 


(10. 7) 式 也 可 以 写成 
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一 mi o 0. 
=k E y." (20-8) 


Bl 10. 1 中 三 个 变量 相互 独立 ,因此 不 必要 再 作 进 一 步 的 分 
Br. 
[1110.21 呼吸 情况 与 年 龄 .吸烟 状况 是 否 有 关 
某 地 区 随机 抽取 9? 人 ,对 他 们 的 呼吸 情况 年 龄 和 吸烟 状况 
进行 调查 ,结果 如 表 10 一 4。 
分 析 : 为 了 检验 这 批 人 的 呼吸 情况 与 年 龄 .吸烟 状 沉 是 否 有 
关 , 可 以 建立 假设 组 
五 :呼吸 情况 .年龄 ,吸烟 状况 相互 独立 
Hr 呼吸 情况 ,年龄 ,吸烟 状况 不 相互 独立 
计算 检验 统计 量 忆 , 采 用 检验 对 假设 作出 判定 ,统计 时 已 可 
以 根据 (10.5) 式 或 (10.6) 计算 .为 计算 简便 ,采用 (410. 6) 式 。 由 于 
R 10—4 呼吸 情况 与 年 龄 ， 吸 烟 状况 调查 表 
呼吸 情况 CE》 


E WRGD 一 一 一 一 一 一 一 一 一 合计 
正常 尚 可 A 


从 不 吸烟 16 15 5 36 
x 40 
TRA 7 34 3 44 
JA FUE ARI 1 3 1 5 
40—59 
TH 1 8 3 12 
EH 25 60 12 07 


A. = (16 + 15 + 5)+(7 + 34+3)=80 
fe =(1+3+D+(1+8+10=17 
Ja =(06+15+5+01+3+1)=41 


D Q= fF E Lame? yg fia — Rana + ela 
== le Erw Fm 
= 222 xf — 23331. + 33304 = XX — 
LOVE. 
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fa = (7 + 34 +3) d (01-8 0 32 = 56 
Foy =16+7+1+1=25 

Lis =15+ 344 3+8= 60 

了 一 5 十 3 十 1 十 3 一 12 


所 以 


r r E I 
— ul tak — — . 
Q =a 2 2 EFI AS 5 ` 15 308 


AMÉ 1 Aya = 0.05,df = T. £48 8 SHAN Xios = 14. 07, 
HA Q — 15.908 > Mi cs = 14. 06, BT LORE XE 5% 的 显著 性 水 平 
EE 想 ,, 这 表明 三 个 变量 不 是 相互 独立 的 。 

当 调 查 数据 拒绝 五, 时 ,可 以 对 列 联 表 和 作 进 一 步 的 分 析 , 研 究 
是 由 于 哪些 变量 引起 拒绝 Ho. 

2. 局部 独立 性 检验 

三 个 变量 间 相 互 独立 性 的 假设 被 拒绝 ,并 不 意味 着 所 有 变量 
之 间 都 存在 着 显著 的 联系 。 可 能 是 两 个 变量 间 相 关 ,而 第 三 个 变量 
完全 独立 , 即 有 局 部 独立 性 ;也 可 能 是 两 个 变量 在 第 三 个 变量 的 每 
一 水 平 上 是 独立 的 ,但 两 个 变量 的 每 一 个 都 与 第 三 个 变量 相关 , 即 
当 给 定 第 三 个 变量 的 水 平时 ,前 两 个 变量 是 条 件 独立 的 ,为 了 能 更 
深入 地 研究 变量 间 的 关系 ,常常 需要 对 列 联 表 作 深 入 的 分 析 .。 例 
如 ,对 二 维 表 建 立 下 述 的 三 个 独立 性 假设 ， 

HU: pin = Pepa 《 行 分 类 独立 于 列 各 层 分 类 》 
HP: Pip = pippa NPAT FAA BAS) 
H: Pu = Papa CAB ITF AMAR HB) 

WH AY Ri Pa = BP ML, BRS pa = pp. FA 
Pia = Pi 成立 ,这 也 就 是 说 ,日 ?是 行 分 类 和 列 分 类 独立 与 行 
分 类 和 和 层 分 类 独立 的 混合 假设 。 

为 检验 假设 ,可 以 按照 与 以 前 相同 的 方式 进行 ,车 HS 为 真 ， 
BU p = Pi Poe 成 立时 ,第 i 认 格 的 期 望 次 数 为 


Er 二 RP Pj 
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FY LAGER BEE D.Don ERA ANA 


Fe. a Por 
Po = PF Pra 一 n 
因此 
Cn = — ye Fi. . La Fe Las (10. 0) 
A n 


实际 次 数 Soe SMERE ex BRT 可 以 用 来 判定 变量 间 相 互 独 

立 的 可 能 性 ,其 差 值 越 小 ,相互 独立 的 可 能 性 越 大 ,反之 , 差 值 越 

大 ,相互 独立 的 可 能 性 越 小 ,检验 统计 量 仍 为 忆 , 其 计算 公式 为 
Q= Y 5 y Gare ia? 


i=] jm] k=l €; ak 


1X 5j C10. 5) AAN. 统计 量 遵从 x* 分 布 ,其 自由 度 仍 用 (10. 6) 
ME REMBO rcl AUS BOR BGT A 和 pon fit pe 的 
数目 为 (x 一 1) 个 ,而 估计 zp. 的 数目 即 列 x 层 的 概率 数目 为 (ct 
— D T.H. E dr BEES 
dí — (rcl — 1) — ir — 1) — (ed — 1) = red —r—cl +] 
ARE PAE AA ARA UE d£, BEK 
F a. UA OE BT LARS PE HSE e 
C 例 10. 3 了 年龄 与 吸 灯 状况 和 呼吸 情况 是 否 无 关 
在 例 10. 2 中 ,年 龄 .吸烟 状况 .呼吸 情况 放 三 个 变量 被 证 明 不 
是 相互 独立 的 ,但 并 不 一 定 说 明 三 个 变量 闻 都 有 昆 著 联 系 A 
利用 表 10 一 4 的 数据 检验 年 龄 是 否 独立 于 其 他 两 个 变量 。 
分 析 :根据 题目 的 要 求 ,应 建立 假设 组 
HP: pin = Bib. 
Hi. pia PrP.a 
用 文字 表述 为 
AY, 年龄 与 吸烟 状况 和 呼吸 情况 无 关 
HiV: 年 龄 与 级 烟 状 况 和 呼吸 情况 有 关 
或 . 
Hu ， 年 龄 独立 于 吸烟 状况 和 呼吸 情况 
204 


H: APRA PRR OL AR TR 
根据 表 10—4 的 数据 ,按照 (10. 9) 式 计 算 各 个 期 望 次 数 , 如 表 
10—5, 
表 10 一 5 ”在 年 龄 和 其 它 两 个 变量 无 关 假 设 下 的 期 望 次 数 


Ff ETE TA 
EC | RR AL) ——————— @ 
ER #4 FT 异常 
AA 14. 03 14. 84 4. 95 33. 81 
< 40 . 
Ug i 5. 60 34. 64 4. 95 46. 19 
MARR 2. 98 3. 16 1. 05 7. 18 
40—59 
mE B 1.40 7. 36 1. 05 9. 81 
ait 25. 00 60.00 12. 00 97 
由 表 10—4 可 知 
fa = 16 3-12 37 Pu =15+3=18 
Fa=7+1=8 f. 34-8 42 
fu=5+1=86 了 .5 一 3 十 3 一 6 
因而 有 | 


em = Af) nn = 80(17)/97 = 14. 02 
em =. (fif a)n = 80(18)/97 = 14. 84 

以 此 类 推 , 得 到 表 10 一 5 的 各 个 期 望 次 数 , 于 是 
Q- 5 $ $ Ve) 


f=] jm] ket Ei 
|. (16 — 14.02) (3 — 1. 05)? 
B 14. 02 TU 1. 05 
= 6.2035 


TEMA ID 中 ,根据 由 一 rc —r— ch +1 = 5, ERE a 
= 0.05, 779 Xia = 11.07, FO = 6.2035 « Yi 0 = 11.07, BT 
以 数据 在 574 的 显著 性 水 平 E 不 能 拒绝 五 , ,表明 年 龄 独立 于 其 他 
两 个 变量 。 

205 


HA 10. 2 FR 10. 3 的 结论 可 以 得 知 ,吸烟 状况 与 呼吸 情况 
AX RI RIS 10 一 4 的 数据 可 以 进一步 验证 这 一 结论 ,对 宕 10 一 4 
的 数据 在 年 龄 变量 上 求 种 , 即 对 i 求 和 ,可 以 将 2 0€ 2 Xx3 列 联 表 折 
送 成 一 张 2 X 3 列 联 表 ,如 表 10 一 6。 

表 10 一 6 8E 10 一 4 数据 对 年 龄 变量 求 和 的 结果 


ARA — L8 m mE E tt 
正常 尚 可 HE 
MARR A 17(10.57) 18025. 38) 605. 07) 41 
E Mm 8(14.43) — 42(34.64) 6£6. 93) 56 
& if 25 60 12 97 
根据 检验 目的 建立 的 假设 组 为 


Ho: 吸烟 状况 与 呼吸 情况 无 关 
及 :吸烟 状况 与 呼吸 情况 相关 
按照 H, 为 真 时 ,二 维 列 联 表 各 个 期 望 次 数 的 计算 公式 ,可 以 
得 到 独立 性 假设 下 的 各 个 期 望 次 数 ,如 表 10 一 6 中 括 导 内 的 值 , 利 
用 (9, 40 式 计算 名 统计 量 得 到 


a= "das Tot iXG6) G9 -1| 
= 10.7864 

TEMA 1 中 ,根据 df 二 (r— De D =2, BREKKE a= 
0.01, 4% Xin = 9.21.4 Q = 10. 7864 > Xi 0, 二 9.21; 所 以 数 
RE 124 的 显著 性 水 平 上 拒绝 H., AAA 2 ER 
AS OF RRB. wm SP AO 等 ,可 以 采用 类 似 的 方法 ,得 
到 各 单元 的 期 望 值 sx。 将 实际 次 数 ,与 期 望 次 数 ej 代 入 (10.5) 
式 , 得 到 对 应 于 某 个 假设 条 件 下 的 统计 量 @@。 按 照 (10. 6) 式 确定 自 
Ei HE fe ,能够 对 假设 作出 判定 。 


$10.2 XH A BORA BEALI BA A it 


前 面 关 于 列 联 表 分 析 的 假设 检验 ,能 够 有 助 于 认识 变量 间 的 
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较为 复杂 的 关系 ,但 还 没有 将 这 些 关 系 量化 , 即 没 有 建立 起 关于 变 
量 间 关系 的 模型 ,对 数 线性 模型 恰恰 解决 了 这 一 问题 ， 
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在 二 维 列 联 表 中 ,检验 两 个 变量 的 相互 独立 性 建立 的 原 假 设 

A | 

Pu = P-P (10.10) 
这 一 等 式 表 明 , 在 总 体内 ,一 次 观察 落 入 表 中 第 i 格 的 概率 为 边 
KRBH RA, 这 实际 上 也 就 确定 了 数据 的 结构 或 模型 。 对 
C10. 10) 式 两 边 同 时 取 对 数 得 到 

ing, = Ing. + Inp., (10.11) 
AA HAAR ej — n * p JAMO. 11) 式 可 以 写 
成 

Ine, = lne,, 十 lne., 一 Inn (10.12) 
将 (10. 12) 式 两 边 同时 对 i 求 和 有 

三 lne; = = Inen + rlne., — rinz 
将 (10. 12) 式 两 边 同 时 对 7 求 和 有 

2 lne; = elne; + 3 Ine., — eina 
将 (10. 12) 式 丙 边 同时 对 i.j 求 和 有 


33 Ine,, = cE Ine. +r Ine.; 一 relna 
i=1 j=1 i=} mn 


TEM 
A Se. ; (10.13) 
FE 
= Ine, 5 X Ine, 
— i=] j=] 
a; m £ re (10. 14) 
3 Ine, 5 2 ine, | 
B 一 三 一 一 一 二 全 一 (10.15) 
cC FC 
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那么 ,(10.12) 式 可 以 写成 
Ine,, =Ata,+ 8, (G—1,2,-,70,/—1,.2»--,.) (10,16) 
xx 2 fp] F2 22 230i P Br FH 85 3853780 (8B P 77 28 4: AR A. C10. 16) 
式 中 ,4 表示 “总 平均 效应 ”,a, SEZRÍTAERESS RATA A 
示 列 变量 第 了 类 的 * 主 效应 ”. 宙 (10. 14) 式 和 (19.15) 式 可 知 ,a 测 
度 了 频数 对 数 的 行 平均 与 总 平均 间 约 偏差 ,而 8, 测度 了 频数 对 数 
芍 列 平均 与 总 平均 间 的 偏差 ,因此 有 
Za =0 Èp, = 0 


(19. 16) 式 是 二 维 列 联 表 两 个 变量 相互 独立 Y 时 的 对 数 线性 模型， 
二 ,对 数 线 性 模型 的 类 型 


对 数 线 性 模型 是 用 来 分 析 定 类 数据 的 一 类 很 有 用 的 数学 模 
型 ,可 以 用 于 反映 列 联 表 中 各 个 变量 间 的 复杂 关系 ,由 (10.16) 式 
可 知 , 对 数 线 性 模型 是 将 列 联 表 上 每 单元 的 频数 作为 因 变 量 , 表 上 
所 有 变量 作为 自 变 量 , 建 立 各 个 自 变 量 的 效应 与 每 单元 频数 的 对 
数 之 间 的 函数 关系 , 用 以 分 析 研 究 表 上 各 个 变量 间 的 关系 。 
(0.10 式 是 两 个 变量 相互 独立 时 的 对 数 线 性 模型 .事实 上 ,变量 
闻 可 能 并 不 相互 独立 , 当 变 量 名 于 两 个 时 ,变量 间 的 关系 还 会 更 复 
ZR. 因此 ,对 数 线性 模 殖 有 很 多 类 型 .本章 只 讨论 几 种 常用 的 和 且 较 
为 简单 的 类 型 。 

(—) 愧 和 模型 (Saturated Model) 

当 变 量 间 相 互 不 独立 时 ,变量 间 的 相关 会 使 变量 相互 作用 ,可 
以 用 方差 分 析 中 的 一 个 术语 “交互 作用 (tinteraction)” 来 描述 列 联 
表 中 变量 间 的 这 种 关系 ,变量 间 相 址 不 独立 时 移 对 数 线 性 模型 称 
为 饱和 模型 ,饱和 模型 中 ,不 仅 有 各 个 变量 的 主 效 应 ,还 应 有 变量 
间 的 交互 作用 效应 ， 

e 615 dex a 

对 于 两 个 变量 壬 了 的 r xc 列 联 表 ,饱和 模型 为 
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相互 不 独立 FALE AS 不 为 9, 模型 AE AAA ARE 
E Un copo dg dH AN A Ea: PA O SY 是 独 
wey. FAK AR = Os MIRA AS CARE RARA ,诸如 和 模 
MPAA LALA LAR ARI A ANTE. 


三 、 模 型 参数 的 估计 


对 数 线 性 模型 的 一 个 主要 优点 是 能 够 佑 计 模 型 中 各 个 参数 ， 
而 这 些 参 数 的 值 , 司 各 个 变量 的 效应 和 变量 间 的 交互 作用 效应 得 
以 数量 化 。 

(一 ) 直接 计算 

在 茶 些 情况 下 ,对 数 线性 模型 可 以 利用 列 联 表 的 各 边缘 次 数 
直接 计算 各 个 效应 参数 。 

两 个 变量 的 信和 模型 ,如 (10. 170 式 , 其 参数 可 以 利用 列 联 表 
的 各 个 频数 直接 计算 得 到 ,以 jx., 表示 各 个 观察 值 对 数 的 总 平均 
值 , 即 总 平均 效应 , 则 有 e = A= OEXInf Dres A p. cn. BFE 
示 第 : 行 , 第 j 列 频数 对 数 的 平均 信 , 妈 有 

p. = (Slofi)/e 


PES 
那么 ,模型 的 各 个 参数 值 计 算 公 式 为 


ÀA = fy. Hu. (10. 21) 
R= n, — B. (10.22) 
A fab + a3) 

= Inf, — i. — p.; 4- p. (10. 23) 


EMMA: ASTORIA INT 0, BHL 

Hi A) ER IE REI i PACA A RR A 是 

AVES y MACARI A E RA 代表 变量 1 

和 变量 2 在 各 自 的 第 i 个 水 平和 第 j 个 水 平 之 间 交 互 作用 效应 ,是 

其 交互 作用 对 总 平均 效应 4 的 增 减 量 , 术 大 于 0, 表 明 效 应 为 正 ; 若 
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短小 于 0, 则 效应 为 负 。 
5 例 10. 4 了 居民 居住 地 区 与 电 风骨 需求 型 式 的 调查 结 时 如 
表 9 一 7。 若 满足 (10. 17) 式 的 关系 , 试 估计 各 效应 参数 。 
表 10—9 % 9 一 7 各 单元 频数 的 对 数值 


AA RA, RR OF E 2) 
(变量 1) 热带 温带 se s 
ax 2. 5391 3. 4012 1. 3853 2. 4755 
落地 式 4. 2047 4. 6540 a 0943 4. 3177 
frs 3. 4012 2. 5649 2. 6381 2. 8684 

3 H 3. 4150 3. 5400 2.7060 3. 2205 


解 ; 根 据 表 9 一 ?7 的 数据 ,计算 表 上 各 单元 频数 的 自然 对 数 , 列 
AR 10 一 9, 回 时 计算 该 者 各 行 . 各 列 的 平均 值 及 总 平均 值 . 很 据 
(10. 21) RA 


Ai = gu. T A 
= 2.4755 — 3. 2205 — — 0. 745 
Ay = d. — Ho. 


= 4.3177 — 3.2205 = 1.097 
由 于 EN = 0, 所 以 
Àj —— (4 AD =~ (一 0.745 + 1.097) =— 0. 352 
根据 (10, 220 HA 
X = py — pm. = 3.4150 — 3.2205 = 0. 195 
A = pa — ge. = 3.5400 — 3. 2205 = 0. 320 
由 于 XU = 0, LL, =— (A +A) =~ (6. 195 + 0. 320) 
— — 0. 515 
ESTARIA fe ud 10—10, 
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Xx 10 一 10 ER eat ie 


变量 i EE 2 
I AL =— 0.745 AD = 0.195 
* 2 Aj = 1.097 AP == 0.320 
t 3 Aj —— 0.852 AP = — 0.515 


根据 (10. 23) RA 
Ai 一 lanfa — Ao — a + A. 
= 2.6391 —2. 4755 — 3. 4150 + 3. 2205 =— 0. 03] 
AN 一 Inf, — Hp 77 a +t pus => 0. 308 
由 于 SAY ~ 0. PILA =— QE + AD —— (— 0.031 一 
0. 308) = 0. 399. F] ,根据 (10. 220 SCHEDE ARA RT EUR 
ŠA 一 0, 推算 AL LT SA, 一 0, 因而 利用 前 面 计算 得 到 的 
AA 可 以 推荐 出 粒 , 同 样 的 方法 能 够 推算 出 ALL AM MEA AE HUM 
应 估计 值 列 入 表 10—11, 
表 10--1! ”变量 间 安 互 作用 效应 估计 值 


AM —— 0.031 AE == — 0.308 AM = 0.339 
Ali = 0. 606 ay = 0.017 Aii — 0.823 
AE —— 0.575 IE = 0. 291 Aij = 0.284 


从 上 面 参 数 计算 过 程 可 以 看 出 ,饱和 模型 需 估计 的 参数 数目 
恰恰 与 列 联 表单 元 数 和 且 相 等 ,办 而 模型 对 数据 完全 拟 合 ,和 例 10. 4 
中 列 联 表单 元 数目 为 3 x 3 — 9, Tfi 9 BBO A ALAR AR AB, 
AA AA EE 9 个, 其余 参 数 均 可 由 关系 式 导出 ,根据 家 
10—10,# 10—-11.4 

Infa = A+ AL + AB + AK 
= 3.220 + 1.097 + 0.320 + 0.017 = 4. 654 
O SR Hh A 
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变量 各 自主 效应 以 及 两 个 变量 的 交互 作 用 效应 均 为 正 效应 巾 表 
10—10 可 知 , 台 式 、 台 地 式 电 风 肩 需 求 是 负 效 应 ,对 总 平均 效应 A 
起 减少 作用 ,而 落地 式 电 风扇 需求 是 正 效应 ,起 增加 作用 ;变量 ? 
中 ,居住 热带 .温带 均 为 正 效应 ,居住 寒带 为 负 效 应 ,由 表 10 一 11 
则 可 进一步 看 出 两 个 变量 交互 作用 的 结果 。 落 地 式 电 风扇 需求 效 
应 为 正 效应 ,但 其 与 居住 地 区 交互 作用 时 , 仅 与 温带 .寒带 交互 作 
用 产生 正 效应 ,而 与 热带 交互 作用 时 是 负 效 应 。 

510.51 在 例 10.2 中 ,年 龄 吸烟 情况 和 呼吸 状况 相互 不 
独立 ,但 在 例 10.3 中 经 检验 发 现年 龄 独立 于 其 它 两 个 变量 , 即 三 
个 变量 间 有 如 表 10 一 8 PA I 的 模型 关系 :4 十 站 十 入 十 怎 十 
vi pie USE A 

解 :假定 各 个 效应 参数 满足 下 列 关系 

EXaco 34-0, SoH 

IH =0, DE 一 0 
那么 ,也 可 以 利用 列 联 表 频 数 对 数 的 行 , 列 , 层 边缘 值 直接 计算 各 
效应 参数 。 

总 平均 效应 参数 》 为 总 平均 值 , 因 此 有 

A= pu. 一 cx x Inf, /rel (10. 24) 


+ 为 变量 EU AA LAU IU WS] 
偏差 ,因此 有 


用 nm. s. (10. 25) 
同 理 可 以 得 到 f 

Aj 一 Bj — Ha (10. 26} 

AR = ug. (10. 27) 


ERA 2 和 变量 3 的 交互 作用 效应 ,因此 有 
| AI — AE AR) 
= Ha — fige — Baa F Ha. (10. 28} 
将 表 10—4 中 的 数据 取 自 然 对 数 , 得 到 表 10 一 12。 
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0.0169. LF X AP 一 0, 所 以 其 它 交互 作用 效应 参数 能 够 得 到 。 
各 不 交互 作用 效应 参数 估计 值 列 入 表 10 一 14。 
表 10 一 14 UR EE SPOR HR SCH fe AML HE 
Av} = 0.. 3367 AH —— 0, 3367 
AR = — 0. 3198 AH = 0.3198 


AH = — 0.0169 A = 0. 0185 


主 效应 大 于 0, RB AERE IE 1 al = 0. 7820 > 0 是 因为 年 
Me 在 40 FUP ASAE 40 岁 以 上 的 人 多 ; 主 效应 小 于 4, 表明 效 应 
为 负 , 如 站 一 一 0.13 二 0, 是 因为 从 不 吸烟 的 人 少 于 吸烟 的 人 。 交 
BREA E 0, 表 了 明 其 交互 作用 效应 为 正 ,如 Ai — 0. 3367 > 0,3€ 
了 未 从 不 吸烟 而 呼吸 正常 的 人 数 , 多 于 促 由 从 不 吸烟 的 人 数 或 呼吸 
TE 党 的 人 数 为 基础 估计 的 平均 人 数 ,也 就 是 表明 从 不 吸烟 类 与 竖 
吸 正 常 类 之 各 存在 着 相关 ,因此 这 类 人 数 比 假定 两 个 变量 (吸烟 状 
A 与 呼吸 情况 ) 无 关 时 所 期 望 的 人 数 要 多 ,交互 效应 小 于 ,表明 
其 交互 作用 效应 为 负 , 邵 AR? = — 0.3367 < 之 0, 表明 吸烟 而 呼吸 正 
党 的 人 人 数 少 于 仅 由 吸烟 人 人 数 或 呼吸 正常 人 数 为 基础 居 计 的 平均 人 
数 ,也 就 是 说 ,吸烟 类 和 呼吸 正常 类 存在 着 负 相 关 。 

对 数 钱 性 模型 的 各 个 效应 系数 是 否 显 著 不 为 零 ,也 和 需要 进行 
统计 答 验 ,这 在 后 面 将 会 介 铝 , 非 饱 和 模型 与 狗 和 模型 不 同 ,其 不 
能 对 询 联 表 的 数据 完全 拟 合 ,由 表 10 一 13、 表 10 一 14 FPA + A 
+ AZ + at + AH = 1.4948 + 0. 7820 一 0.13 一 0.3152 + 0. 3367 
= 2.1683 Aln fi = 2.7726。 这 是 由 于 模型 中 需要 估计 的 参数 数 
目 少 于 列 联 表 上 单元 的 数目 .在 例 10. 5 中 , 列 联 表 的 单元 数目 为 ? 
X 2 X 3 12, 而 需要 估计 的 参数 只 有 5 个 ,其 余 均 由 效应 参数 向 
关系 推算 而 得 。 — l 

用 对 数 线性 模型 分 析 高 维 列 联 表 ,需要 样本 数 自 很 大 ,全 此， 
实际 应 用 时 ,常常 采用 “压缩 * 的 方法 ,将 高 维 表 就 变量 中 的 某 一 
个 折 送 ,成 为 概 维 列 联 夷 ,一 般 来 说 .三 个 变量 间 是 局 部 独立 性 关 
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% MUR 10-8 中 模型 | 类 拟人 台数 据 满意 时 ,就 三 个 变量 中 的 
任何 一 个 折 迁 列 联 表 ,简化 以 后 分 析 都 是 可 行 的 ;而 三 个 变量 是 茶 
御 独立 性 关系 , 即 需 用 模型 X 类 拟 合 数据 时 ,以 哪个 变量 折 选 列 
联 表 , 应 持 谨慎 的 态度 ,以 避免 导致 虚假 的 结果 ,例如 , 例 10.3 表 
明 ,年龄 与 吸烟 状况 ,呼吸 情况 是 局 部 独立 性 关系 ,因而 可 以 对 年 
龄 变量 求 和 ,将 2 Xx 2 X3 表 折 夺 成 2? Xx 3 表 , 如 表 10 一 6, 利用 该 
表 建 并 对 数 线性 模型 ,研究 黄 个 变量 的 主 效 应 以 及 交互 作用 效应 。 
表 10—15 ER 10 一 6 中 各 频数 的 自然 对 数 及 均值 . 表 10 一 16 是 种 
PERO , 表 10 一 17 是 各 个 交互 作用 效应 。 
$4 10—15 5% 10-6 相对 应 的 各 频数 对 数 
吸烟 状况 呼 性 情况 (变量 2) 


CERO D ER a se © 
PRU IBI 2. 8332 2. 8804 1.7918 2.5051 
m E 2.0794 8. 1377 1. 7518 2. 5363 
Bod oc 2. 4563 3. 3240 1.7918 2. 5207 
表 10—16 x RE fit 
pa i 变量 I 
i al =— 0. 0158 A =-— 0.0644 
类 2 Àj = 0.0156 Àj = 0. 7933 
3 Al = 0.7289 


表 10—17 ar HAA Erf fi 


AH — 0. 3925 Mz —— 0.3925 
ài — — 0. 4080 aM = 0. 4080 
AE = 0.0155 +. b= 80,0155 


对 比 表 10—16 AI 10-13 WSK. RHEE REED 
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量 , BAR A ERE AB, JA AA BA] ERU 8 10€ 
烟 的 主 效 庶 为 正 AO ee B9 588 CECI I] FEAR AS EE d 
变量 时 , 表 10—16 的 结果 显示 从 不 吸烟 对 的 减少 量 为 0. 0156, 
而 考虑 年 龄 变量 时 , 表 10 一 13 显示 的 减少 量 为 0.13。 好 吸 情况 恋 
量 也 有 类 似 的 结果 。 对 比 表 10 一 17 HR 10 一 14 可 以 看 出 ,吸烟 状 
1X, 与 呼吸 情况 两 个 变量 交互 作用 效应 受 年 龄 变量 的 影响 较 大 .从 
不 吸烟 与 呼吸 异常 交互 作用 在 考虑 年 龄 时 为 负 效 应 ,而 不 海 虚 年 
龄 时 为 正 效应 ;吸烟 与 呼吸 异常 的 交互 作用 恰恰 相反 Et 
为 正 效应 ,不 考 虚 年 龄 时 为 灸 效应 ;并 且 交 互 作用 对 总 平均 效应 e 
的 增 减 重 都 有 所 不 同 。 

[5110.6] 调查 4.B8 两 所 医院 产妇 护理 及 婴儿 生存 情况 的 
资料 如 表 10—18, d (Gr Bed X BEAR. 

H 10-18 PAPES SANER 


票据 生存 情况 C2) 
E CO 产 前 护理 次 教习) - 
$t i 着 

Ber 8. 176 
A 

HS 4 293 

ir 17 197 
E a 

Hz 2 23 


分 析 :根据 表 10 一 18 的 数据 ,分 别 考察 4.B 医院 的 产 前 护理 
次 数 与 婴儿 生存 情况 是 否 相 关 。 利 用 六 T B iro. 4) AR 
总 统计 量 得 到 

Qa =n E fiffa 11- 
= 476L9/7(179) + 16/7 (297) + 176?/469(179) 
+ 293'/469¢297) — 1] 
= 0. 0476 
Q = AZ E fuf, — 1j 
= 239117*/19(214) + 4/19(25) + 197*/220(214) 
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+ 2327220(25) — 11 

= 0. 0000418 
Qa Os PEF 0, RAE BER A, BUTE A 医院 .8B 医院 , 产 前 
PRD Sy SUL "ETE TE OLIR EUR SL LEUTE AE Bb X LY LZ 来 说 ,存在 
条 件 独 立 性 ,也 就 是 在 天 的 每 个 水 平 上 ,了 55 Z 相互 独立 ,这 种 情 
更 下 , 若 对 医院 变量 求 和 ,将 2 X 2 X2 表 折 送 成 2 X2 表 ,如 表 
10 一 19, 考 察 产 前 护理 次 数 与 柑 儿 生存 情况 的 相关 情况 。 仍 利用 入 
eae ,计算 名 Bit EH 

Q = nlf E RS, — 1) 
= ?15[20'/26(393) + 3733/689(393) + 6*/28(322) 
+ 316°/689(332) 一 1] 


= 5. 256 
E 10—19 PIPE $55 SLE OX 
EULER 
产 前 护理 次 数 一 一 一 一 一 一 一 一 一 一 一 一 一 。 合 i 
EJE EG 
E 起 20 373 333 
HS 6 318 322 
€ + 26 588 715 


根据 由 = (r— Dc 1) = 1,a = 0.05; EB GE 1 ,得 到 Xs 
= 3.84. BF. Q = 5. 256 > Xi os 一 3.84, 所 以 ,数据 表明 产 前 护理 - 
PS BILIAR AAN AZAR 
FLA EVE Sr ES AR MIA OY AE RRS II E 
用 对 数 线 性 模型 ,考察 变量 间 的 关系 是 最 合适 的 。 

(=) ik 4X it X iE 

对 于 不 能 直接 求解 的 模型 ,可 以 采用 和 迭代 法 求解 各 个 效应 系 
数 佑 计 值 . 选 代 计 算法 亦 称 重复 估算 法 ,用 于 独立 模型 各 谱系 模型 
的 区 应 系数 估计 .迭代 过 程 直到 两 次 迭代 估计 值 之 差 小 于 给 定 的 
收 侣 标准 为 止 . 一 般 采 用 极 大 似 然 估计 准则 。 有 兴趣 的 读者 可 参看 
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A E E RIE BJ S618 SB BR DLAE 
i DO. ALE CO. 29 式 。 若 随机 变量 上 为 连续 的 ,其 联合 密度 
EA AGO. OO. 29) RAR ARS BIS AA 
HO 二 一 [fol funde (10. 30) 
AE E a A EE A E 
考虑 两 个 随机 变量 XY MEIRE HOC Y) 为 


H(X,Y) =~ X X pln, (10. 31) 
f=l7=1 
E ES XY Z WHA os 
F E i ' 
[ux] j=] &— 


Aili c B BR LAE B (I A EE SES A, Re 
uM ES ES ERE ER E NE bs 
BEAR SER A ARIK. 

PESA A EDS, RY BI ADLER EGER A 
BOE SABLE AAA He UR ESE 
用 来 检验 变量 间 的 独立 性 ,由 于 利用 炉 的 减少 可 以 研究 变量 间 是 
否 相 关 , 即 独立 性 ,而 用 频率 代 兰 概率 ,家 接 和 根据 列 联 表 的 频数 可 
以 计算 得 到 反映 变 基 相互 独立 时 的 塘 , 恰 恰 这 也 就 是 似 热 比 统计 
量 4 的 函数 一 2ln4 .因此 ,检验 对 数 线性 模型 拟 合 的 效果 ,也 就 是 
检验 变量 间 存 在 何 种 关系 ,可 以 采用 炳 或 似 然 比 , 当 样 本 量 趋 于 元 
HARD, 一 2ln4 的 极限 分 布 是 x? 分 布 , 所 以 常 也 称 作 7 似 然 比 , 亦 
HUE XC 8G HE, 

2， 两 个 变量 的 Y! da 

APR XA Y 不 独立 时 ,联合 情 为 

HOX,Y) 一 一 EZ pi In pi; 
MEX, Y 相互 独立 时 ,有 py = pi. po MUA 
Has X,Y) 一 一 22 pupulan Pp, 
XY 独立 时 ,联合 的 炉 达 到 最 大 ,因此 ,可 以 用 上 述 两 式 的 差 表 示 
222 


XY 间 的 相关 情况 ,由 有 

Has (X,Y) m HuX,Y» 

一 22p, in Py 一 XE. Pi: In Pu. P.i 
HFT Ep. p, = JEU EX BASH, 

Has GOL, Y) — H(OX,Y) = EX p, In x 
用 频率 代替 概率 ,得 到 


式 中 ,ff; gas cj mia f. 是 第 ; 行 的 频数 和 ， 了 ;是 第 ;7 列 的 频 
数 和 , 即 为 边 绿 次 数 ,n 是 样本 总 数 ,x? ORAM BBE 
df = (&— De DISx aban TERR 1 OD, BRA ALE df geste 
量 相互 独立 的 假设 成 立时 E ERR PLE A 
果 , 疹 概率 越 大 ,表明 模式 的 拟 合 效果 越 好 ,在 多 元 线性 回归 中 , 采 
用 拟 合 优 度 R 考察 模型 的 拟 合 效果 ,R’ 越 大 越 好 ,对 数 线性 模型 
采用 Xi PRAMS REx 越 小 越 好 。 

3. EDE AU RO 

愉 验 三 个 变量 所 建立 的 对 数 线性 模型 拟 合 效果 , 仍然 可 以 利 
FA X10. 32) 式 的 阁 似 然 比 统计 量 ,. 但 由 于 变量 间 关 系 不 同 , 相 应 的 
.概率 佑 计 不 同 ,好 pin MAAR. ARS HHS ABS. 
根据 表 10—7. 3€ 10 一 8 的 变量 关系 和 模型 类 型 分 别 讨论 如 下 。 

I. (和 7YZ)。 三 个 变量 相互 不 独立 ,建立 恤 和 模型 .模型 对 数 
据 完全 拟 合 ,总 = 0, 若 利用 列 联 表 频数 计算 ,可 直接 代入 (10. 32) 
RGR GH 

LA YD RX SCY ,2) 独立 ,有 Pw = Pa pao RULE 
SY ITA 

B=B,+n, 

= 一 2p. la 5... 一 22P. in pos 


D G = Hes — H.W 2nG =- ?lnA 


223 


一 一 yi Inde — 3 sha In Ez (10.34) 
BEY XZ) 或 (Z,XY) A a m vs ARA H 
是 注意 概率 间 的 关系 变化 ,因而 观测 频数 f.; 的 下 标 也 发 生 相 应 
的 变化 。 | 
I. AY DD 这 时 是 条 件 独 立 的 情况 ,用 条 件 概 率 较为 方 
便 。 由 于 
Pe = POX Ssi- P= (¥ =j[X =D*PUZ=klX=0 


=p 
所 以 .联合 精 的 估计 为 
H = EE she Peg Eg Bes 


33 pta fo mé fates 


AA D 
ln In, 
oT fa 
- 234 in f (10. 35) 


这 一 类 的 其 余 模型 可 以 采用 类 似 方法 求 得 联合 精 。 
W.CX,Y,2) AE NE R EOL ROL. A Pia = Pio 
Py RB Ait A 
H=HA,+ By + A: 
=~ Ê inte In Le 
n > A n 


NER (10. 36) 


根据 似 然 比 的 含义 及 两 个 变量 的 X* 似 然 比 计算 可 知 ,对 于 三 

个 变量 的 22 似 然 比 ,也 可 以 利用 变量 相互 独立 时 的 联合 炳 与 欲 建 

立 的 模型 所 对 应 的 联合 炉 之 差 得 到 ( 炉 的 变化 与 似 然 比 的 变化 是 

等 价 的 ) .这 一 计算 比较 麻烦 ,好 在 电子 计算 机 的 运用 提供 了 方便 ， 
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特别 是 一 些 统计 应 用 软件 如 SPESS SAS 等 ,都 有 对 数 线 性 分 析 的 
功能 ,能 够 直接 运用 。 

E 例 10.73 性 别 . 任 现职 与 转业 意愿 的 关系 分 本 

在 某 地 区 对 某 些 人 进行 调查 ,结果 奶 表 10—20, 4 BTWESE— 
个 变量 间 关 系 。 

分 析 : 这 三 个 变量 都 是 定 类 尺度 测量 的 变 基 ,属于 定性 变量 。 
三 个 变量 间 关 系 的 分 析 可 以 采用 对 数 线性 分 析 方 法 ,就 三 个 变量 
可 能 的 所 有 关系 分 别 建 立 对 数 线性 模型 ,计算 每 个 模型 的 好 , 根 
据 自由 度 , 在 附 表 工 中 查找 H = PER RR TR 
比 统 计量 (一 21n A B x25 为 某 值 的 概率 . 慨 率 值 越 大 ,表明 验 越 显 
Bo 独立 模型 应 拒绝 , 而 该 模型 拟 合 效果 起 好 . 痊 EBGEB 
(10.37) 式 确定 ， 

表 10 一 20 ”性别 ,现职 及 转业 帝 申 调查 结果 


性 5 H 职 转业 意愿 (Z) 
(D (Y) 有 无 
3E dede oy 35 19 132 
农业 劳动 0 9 
AE Mp 95 zh 11 52 
农业 劳动 6 97 


dí = 表 上 单元 数目 一 模型 拟 合 中 需 估 计 的 参数 数目 (10. 37) 
对 表 10 一 20 的 数据 进行 各 种 拟 合 ,结果 如 表 10 一 21。 其 中 自 
h RERE CO. 372 式 计算 。 如 对 于 (X,7,Z) 由 表 10 一 8 可 知 ,模型 需 
估计 的 参数 为 4 中居. 下 ,共计 4 个 , 表 中 单元 数 且 为 8, 则 自由 度 
df 一 8 一 4 一 4. 其 它 模 型 马 似 然 比 统计 量 的 自由 度 可 以 类 推 。 
K 10 一 21 的 结果 表明 ,模型 (YZ,XY) 的 氢 合 效果 最 好 ,其 PP 
值 最 大 ,说 明 在 五 ,成 立时 六 大 于 等 于 表 中 数值 的 概率 很 大 ,其 余 
模型 拟 合 均 不 理想 .由 模型 拟 合 效果 也 可 以 看 到 变量 闻 的 关系 。 表 
10—21 中 ,凡是 忽略 瑟 与 了 间 关 系 的 模型 ,其 难 的 已 值 均 为 0, 氢 
BARRE RARE SMEARS BO AB. 
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X 5Zznid RRA 08 OXZY Ig gum H xg P a, 
很 小 ,甚至 为 ,表明 性 别 和 转业 意愿 之 间 没 有 相关 性 。 模 型 (Y2， 
SY 氢 合 得 好 ,表明 兰 个 变量 间 是 条 件 独立 性 关系 ,在 了 的 每 个 
水 平 上 ,总 与 了 不 相关 ,与 天 和 2 分 别 相关 ,也 就 是 说 ,性 别 与 现 
WR, 现职 与 转业 意 芋 相关。 


表 10—21 ARTIE ARO 

aa xi df P ii 
(X,Y,Z) 137. 93 4 0. 000 
(X.Y Z) 131. 68 8. 0. 000 
(YX ZO 137. 1 3 0. 000 
(PAVO 8.13 3 0. 043 
(XZ YD 131. 46 2 D. 000 
(NZ, XY) 7. 8] 2 0. 019 
(YZ, XY} 1. 88 2 0. 390 

(XYZ) " 0 
Cz) 残 差分 析 


饱和 模型 对 联 列表 数据 完全 拟 合 ,四 而 不 存在 残 差 , 即 残 差 为 
0, 但 对 于 其 它 模型 ,就 不 能 保证 每 单元 的 观测 值 与 期 望 值 完全 相 
等 ,因而 有 必要 进行 残 差 分 析 。 

残 差 用 以 表明 模型 对 数据 的 氢 合 程度 . 残 差 越 小 ,表明 模型 的 


拟 合 程度 越 高 ， 
L REKE 
ERA T CRS HA SOR 
RE 一 该 单元 观测 值 一 期 望 值 《10. 33) 


对 于 二 维 表 来 说 , 残 差 RESID 为 
RESID = f, — e, 

对 于 三 维 表 来 说 有 
RESID = fin — ej 


D 3'BA BER ETE EAEAP 计算 得 到 ,以 后 的 计算 均 采 用 该 软考 
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由 于 实际 观测 值 可 能 大 于 或 小 于 期 望 值 ,因而 残 差 可 能 为 正 ,可 能 
为 负 , 无 论 正 负 , 残 差 越 接 近 于 0, 表 明 模 型 的 拟 合 程度 越 高 。 
2. dB ex X 
为 使 用 时 更 方便 ,人 们 对 原始 残 差 给 予 各 种 方式 的 校正 ,其 中 
Pearson 标准 化 残 差 应 用 较为 广泛 ,其 计算 公式 为 
标准 化 残 差 一 EV — 10. 39) 


MBR o 


0 20 40 60 80 100 120 140 160 
A 


Fl 10.1 各 单元 标准 化 残 整 国 10.2 ZETA 
SRA as 与 期 望 信 对 应 图 
若 模 型 选择 正确 , 则 标准 化 残 差 接近 正 态 分 布 , 一 般 标 准 化 残 差 在 
土 1. 96 范围 内 表明 残 差 不 大 ,模型 选择 合适 , 拟 合 效果 为 好 ,家 
10—22 是 铺 10. 7 中 ,模型 (XY ,了 2) 各 单元 的 原始 残 差 和 标准 化 
残 差 ,由 胡可 知 , 标 准 化 残 差 全 部 落 在 + 0. 80 内 ,表明 残 差 很 小 ， 
模型 的 拟 合 效 果 确 实 很 好 ,如果 标 准 化 残 差 近 似 正 态 分 布 ,那么 各 
单元 标准 化 残 差 与 观测 值 , 期 望 值 在 直角 坐标 图 上 形成 直线 排列 ， 
图 10.1 是 表 10—22 各 单元 观测 频数 与 标准 化 残 差 的 对 应 图 .二 
10. 2 是 各 单元 期 望 频数 与 标准 化 残 益 的 对 应 图 .由 图 可 以 看 出 ， 
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它们 的 点 分 布 差异 不 大 ,表明 模型 适合 这 些 数据 ， 


X 10—22 机 型 5XF ,YZ} po 
单元 频数 Se 5c AAS iErd Rinks REIL 

19 21.17 — 2.17 — 0.47 

132 125.83 2.17 0.15 
a 心 - 48 — ¿dE — Q0. 65 
8 8.52 O. 48 0. 17 
11 9. 83 2.17 0.73 
52 54.17 — 2.17 一 b. 29 
5 5.52 O. 48 0.21 
oF 97,48 一 Q. 48 — 0.05 

— MARE 


对 于 一 批 数据 来 说 ,用 什么 样 的 对 数 线 性 模型 拟 合 最 好 , 即 用 
哪 类 模型 能 最 恰当 地 反映 变量 之 阿 的 关系 ,需要 对 模型 进行 选择 。 
模型 选择 实际 上 就 是 寻找 .识别 最 合适 的 模型 ,对 数 线性 模型 选择 
的 方法 主要 有 :系数 选择 法 ,x 似 然 比 法 . 自 后 淘汰 法 等 。 

(—) 系数 选择 法 

加 归 分 析 法 中 判断 所 选 自 变量 是 否 合适 ， 或 说 是 否 建立 的 为 
最 优 回归 方程 ,常常 采用 回归 系数 的 上 检验 法 .对 数 线性 分 析 与 其 
类 似 , 模 型 建立 后 ,各 个 效应 的 估计 值 是 否 显著 也 应 进行 检验 。 通 
过 效应 系数 的 显著 性 可 以 判断 该 效应 项 包 食 在 模型 中 是 否 合理 。 
对 歼 线 性 模型 系数 的 检验 通常 用 Z 检验 法 .2 值 为 


(Zi > 1.96, ROR EM 0, 该 效应 项 应 在 模型 中 保 
BR [Z| < 一 1.96, 则 系数 与 0 无 显著 差异 ,该 效应 项 需 删 除 。 
[í510.8) 采用 系数 选择 法 为 表 10 一 20 的 数据 选择 合适 
的 对 数 线性 模型 , 
分 析 :采用 系数 选择 法 确定 合适 的 模型 ,首先 应 建立 恤 和 横 
型 ,然后 对 每 个 效应 系数 进行 显著 性 检验 .利用 表 10—20 的 数据 
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建立 饱和 模型 ,得 到 各 个 主 效应 以 及 交互 效应 的 估计 值 \,Z 值 ,如 
E 190 一 23, 和 由 于 总 平均 效应 在 各 类 模型 中 必 不 可 少 ,因而 检验 时 
可 不 考虑 。 

MZ 10—23 的 结果 可 知 ,交互 效应 项 AU 的 系数 估计 值 的 绝 
对 值 很 小 ,相应 的 12Z1= 0. 4064 之 1.96, 家 明 该 效应 项 不 显著 ,其 
为 和 的 可 能 性 极 大 ,因而 将 其 包含 在 模型 中 不 合适 。 在 谱系 模型 
中 , 低 阶 效应 项 为 0, 相 应 的 高 阶 效 应 项 必然 为 0, 因 此 ,2 绚 二 0。 由 
表 10 一 23 也 可 箱 , 二 次 交互 作用 效应 项 ALS. 的 系数 估计 值 绝对 舍 
很 小 ,1Z| = 0. 1034 < 1. 96, 该 效应 项 确实 也 应 删 去 .对 于 交互 效 
应 项 AD FE SER VBE OA Z (US LZ | = 14215 < 
1. 96 ,似乎 并 不 显著 ,但 系数 估计 值 为 0. 2772 并 不 很 小 ;这 时 应 结 
合 其 他 方法 考察 。 

97) 10 一 23 痢 主 效应 ,交互 效应 拓 计 值 .2 it 


效应 系数 估计 值 ZE 
al — 0.4300 — 2. 2047 
aj 0. 7813 4. 0062 
aj — 1.1359 — 5. 8244 
Ai 0. 7934 4. 0883 
HE — 0.0793 — 0, 4064 
a8 |^ (2772 1.4215 — 
- Ai 0. 0202 — 0. 1034 


CÓ MRE 

XP 似 然 比 法 亦 称 模型 分 块 选择 法 . 它 是 利用 x? 似 然 比 的 性 质 
来 选择 适宜 的 对 数 线性 模型 的 方法 .在 回归 分析 中 , 当 模 型 增加 一 . 
个 新 的 变量 时 , 若 拟 合 优 度 R* 增 大 ,表明 该 变量 对 模型 有 资 献 .这 
ER? 的 增加 量 刻 划 了 新 变量 所 提供 的 附加 信息 ,在 对 数 线 性 分 
析 中 ,六 似 然 比 的 减少 量 可 以 鹿 划 变量 对 模型 贡献 的 太 小 ,车模 型 
引入 一 个 效应 项 ,使 六 似 然 比 沽 人 少 , 则 该 效应 项 对 模型 有 过 献 ; 反 
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Lo HABI 27 似 然 比 增 大 , 则 该 效应 项 不 应 引入 模型 .对 
于 对 数 线 性 模型 来 说 ,x 似 然 比 越 小 ,表明 模型 越 好 ,含有 不 同 效 
应 项 的 两 个 模型 x 似 然 比 之 差 秆 ,恰恰 反映 了 两 个 模型 中 不 同 效 
采用 关 似 然 比 法 选择 模型 ,一 般 是 设计 几 种 除 饮 和 模型 以 外 
的 模型 ,分 别 计 算 OP 似 然 比 ,根据 尖 似 然 比 的 变动 作为 模型 选择 
/的 依据 .设计 模型 时 ,可 以 从 独立 模型 , 即 只 有 主 效应 的 模 浒 开始， 
依次 引入 各 个 交互 作用 效应 项 ;也 可 以 从 包含 效应 项 最 多 的 模型 
开始 ,依次 减少 各 个 效应 项 。 
E 例 10. 9 于 采用 她 似 然 比 法 为 表 10 一 20 的 数据 选择 合适 
的 对 数 线 狂 模 型 
Zr Er: 从 独立 模型 (XX, 了,Z) FER ARCE NULA AA, ime 
10—21 ARS MA XYZ) 83 XE = 137. 93 ARRAS P = 0.0 
<0. 05 , PENA AR ME ASE ERA YZ) ,模型 
(XYZ) f XZ = 131. 68, Hah WA x? SR AY {A 137. 93 
一 131.68 = 6. 25,9| A. YZ 交互 效应 使 E 减少 ,表明 该 效应 项 对 
BUE PUR. MR OX YO 的 难 显 著 性 水 平 已 = 0.0<00. 05,8 
明 模 型 仅 有 YZ 交互 效应 项 的 假设 应 予以 否定 ,模型 中 引入 XZ 
TH. Xz = 137.?1, 比 模型 引入 YZ GAY XE HK, Hho A ER 
减少 0. 22, HMC XZ ALERA PUR VY XZ) BE 
型 应 子 以 否定 。 模 型 若 引 入 XY 交互 效应 项 ,总 -= 8.13, 比 独立 模 
型 的 六 很 然 比 大 大 减少 ,表明 交互 效应 项 XY 对 模型 有 和 贡献 ,但 模 
RI ,XY) 闪 的 显著 性 水 平 P = 0,043 < 之 0.05, 仍 需 和 否定 ,依照 上 
面 的 方法 ,对 后 三 个 模型 进行 判定 ,最 后 一 个 模 丽 (XZ AO 0 
最 小 , 仅 为 1. 88 ,与 独立 模型 的 奏 = 137. 93 相 比 ,减少 137.93 一 
1.88 = 136. 05, 差 值 很 大 ,表明 交互 效应 项 YZ.XY 对 模型 贡献 很 
大 ,好 的 显著 水 平 忆 一 0. 39 > 0.05, 表 有 明 模 型 包含 这 两 个 交互 效 
应 项 的 假设 不 能 被 否定 .利用 O 似 然 比 法 选择 的 最 优 对 数 线性 模 
RUSOZ,XYO,BI A -HA — AP +E aR + AH OAR, 
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(=) RICA 

自 后 淘汰 法 亦 称 向 后 删除 法 , 它 是 利用 变量 选取 模型 的 方法 。 
开始 将 所 有 效应 包含 在 模型 之 中 ,可 以 建立 愧 和 模型 ,也 可 以 是 任 
何 一 个 谱系 模型 .在 谱系 模型 中 ,变量 的 高 阶 效应 存在 ,其 低 阶 效 
应 必 存 在 ,如 模型 中 车 存在 三 个 变量 的 交互 效应 项 A ARA 
AM AAR LAR A Aza. I, See RS A a a r U 
表示 即 可 ,这 被 称 作 “模型 的 生成 类 ”*. 如 表 10 — BAA, (XYZ) 表示 
模型 中 含有 全 以 及 所 有 较 低 阶 的 其 他 效应 项 ,而 (Z7、CXY) 表示 
AA+ À E M FALL ALAN 是 第 1 个 变量 互 与 第 2 个 
变量 了 的 最 高 阶 效应 项 ,而 Z 只 以 主 效 应 存在 , 自 后 淘汰 法 是 从 模 
型 的 最 高 阶 歼 应 开始 ,依次 膛 个 淘汰 使 XE 变化 最 小 的 效应 , 换 句 
话说 ,是 通过 兴 检 验 对 应 于 生成 类 的 效应 是 宕 为 0, 逐 个 删除 那些 
在 给 定 的 显著 性 水 平 上 (一 般 选 为 0.05) 不 能 否定 为 0 的 效应 项 ，; 
UB ET RR ER , 则 删除 其 中 最 大 显著 水 平 对 应 的 项 ,直至 得 到 
最 好 生成 类 ， 

C 例 10.101 采用 自 后 淘汰 法 为 表 10 — 20 的 数据 选择 最 适 
宜 的 对 数 线 性 模型 

分 析 ; 首 先 建立 饱和 模型 (XYZ}? , 83] Y — 0, 次 删除 最 高 阶 
效应 项 家 ,也 就 是 生成 类 (XYZ), 则 驻 = 0.701, B HH df = 1, 
概率 P = 0. 4024, 这 表明 生存 类 (XYZ) 为 0 的 概率 是 0.4024 > 
0. 05, 不 能 否定 该 项 效应 为 0, 其 对 模型 的 影响 不 显著 ,故而 应 删 
除 , 得 到 第 一 步 的 最 好 生成 类 (XY ,XZ ,YZ), 这 是 最 高 阶 效应 为 
三 个 两 两 交 互 效应 项 的 模型 ,由 于 有 三 个 生成 燃 (XY), XZ), 
(YZ), 故 应 分 别 考察 ,计算 结果 如 表 10 一 24。 由 表 可 以 看 出 ,生成 
类 (XY) 效应 项 为 0 的 概率 P = 0. 2772 >> 0.05, 不 能 否定 为 0, 故 
应 删除 , 若 将 其 删除 ,重新 建 模 驻 一 1. 8819,P = 0.39 > 0. 05, € 
明 该 和 化 应 项 对 模型 的 影响 不 螺 著 ,可 以 删除 ,得 到 第 二 步 的 最 好 生 


(D SPSS 软件 中 有 自 后 淘 梁 法 功能 ,本 外 采用 该 软件 完成 。 
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表 10 一 24 第 一 步 生 成 类 的 检验 值 


检验 项 E EE xi. P 
AF i 130. 757 o. 6000 
AZ 1 1. 181 0. 2772 
YZ 1 7. 209 ü. 0073 


成 类 (X7,Y2Z)。 对 第 二 步 生 成 类 的 两 项 人 XY)、 YZ) 分 别 进行 检 
验 , 计 算 结 果 如 表 10 — 25. 由 表 可 知 ,两 个 生成 类 项 为 0 的 概率 均 
小 于 5 多 ,否定 该 项 为 0 的 假设 .这 样 ,用 自 后 淘汰 法 得 到 的 最 好 模 
型 为 (XY,YZ)。 

$ 10.8, 10. 9. 例 10. 10 分 别 采 用 三 种 方法 为 表 10 一 20 的 
数据 建立 对 数 线性 模型 ,结果 都 选择 了 模型 (XY YZ), Bp 

Ine, — AH AAA A E 

这 BEA UR) RAF CE E 3C MENNIE 


ERRER. 
3* 10—25 第 二 步 生成 类 的 检验 值 
检验 项 df XL P 
XY 1 129. 798 0. 0000 
YZ 1 . 6. 250 0. 0124 


例 10.7 对 模型 (XY YD HA pP Hi HE Hd IL = 
1.8819, P = 0. 390 > 0.05, 表 明 模 型 对 数据 总 的 拟 合 程度 很 好 。 
表 10 一 22 显示 ,模型 得 到 的 各 单元 期 望 值 与 实际 观测 值 之 间 误 差 
的 最 大 绝对 值 为 2. 17 ,最 大 标准 化 残 差 绝对 值 为 0.73, 没 有 超过 
1. 96, 说 明 每 个 单元 模型 拟 合 数据 程度 很 高 .模型 通过 了 拟 合 程度 
的 检验 ,表明 该 模型 确实 是 对 数据 拟 合 最 好 的 模型 。 — 
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附 表 五 ; 单 样本 K-S 检验 统计 量 
UN T BS O01 EE ES 
N .200 .100 .050 .020 .010 


-100 .050 .025 .010 . 005 
单 俩 检验 的 右 尾 概率 


如 果 入 守 40, 则 按 下 面 的 计算 得 到 近似 的 概率 ， 


双 侧 检验 的 右 尾 概率 
. 200 .100 . 050 . 020 . 010 
LOTIN — 1.22 VN. — 138 VN — L52N 1.63 YN 
. 100 - 050 . 025 . 010 . 005 
单 们 检验 的 右 尾 概 率 
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